消 华 大 学 出 版 仁 


清华 大 学 出 顾 储 
北大 


内 容 人 简介 


本 书 根据 我 国教 育 部 教学 指导 委员 会 制定 的 “高 等 学 校 计 算 机 科学 与 技术 专业 规范 ”组 织 编写 ,与 美 
国 ACM 和 IEEE CS 计算 机 课程 最 新 进展 同步 ,内 容 涵 盖 了 知识 领域 CS-AR 计算 机 体系 结构 与 组 织 的 核 
心 知 识 单元 和 知识 点 。 全 书 共 分 8 章 , 第 1 一 7 章 全 面 讲 述 单 处 理 机 系统 的 硬件 组 织 和 结构 ,包括 计算 机 
中 的 数据 表示 和 运算 .汇编 级 机 器 组 织 .存储 系统 的 组 织 与 结构 、 输 入 输出 系统 的 组 织 .CPU 的 组 织 与 结构 
及 总 线 和 接口 等 ; 第 8 章 介 绍 当 前 并 行 处 理 机 系统 的 一 些 主流 技术 和 体系 结构 ,包括 流水 线 技术 .多 处 理 
机 系统 .机群 系统 和 多 核 处 理 器 等 。 

本 书 是 作者 根据 近 二 十 年 计算 机 组 成 与 计算 机 体系 结构 课程 教学 之 经 验 , 并 在 教学 和 科研 过 程 中 不 
断 积 累 和 提炼 而 写成 的 。 本 书 条 理 清 晰 ,概念 准确 ,所 组 织 的 内 容 不 仪 全面, 而且 整合 了 大 量 的 新 技术 、 新 
知识 ,为 读者 展现 近 些 年 来 计算 机 技术 发 展 的 新 成 果 ，。 

本 书 适合 作为 各 类 高 等 院 校 计算 机 科学 与 技术 专业 的 教材 ,也 可 作为 相关 专业 工程 技术 人 员 和 计算 
机 爱好 者 的 参考 书 。 


本 书 封面 贴 有 清华 大 学 出 版 社 防 伪 标 签 ,无 标签 者 不 得 销售 。 
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图 书 在 版 编目 (CIP) 数 据 


计算 机 组 织 与 结构 / 徐 苏 主编 .-- 北 京 : 清华 大 学 出 版 社 ,2015 
21 世纪 高 等 学 校规 划 教材 ， 计算 机 科学 与 技术 
ISBN 978-7-302-39559-1 


1. OD 计 … 工 . 也 徐 … 了 且 . 只 计算 机 体系 结构 一 高 等 学 校 一 教材 N. DTP303 
中 国 版 本 图 书馆 CIP 数据 核 字 (2015) 第 046554 号 


责任 编辑 : 刘 癌 威 苹 阳 
责任 印 制 : 


出 版 发 行 : 清华 大 学 出 版 社 
网 址 : http : / /www. tup. com. cn, http: //WWWw. wgqbook. com 
地 址 : 北京 清华 大 学 学 研 大 厦 A 座 邮 
杜 总 机 :010-62770175 由 B 
投稿 与 读者 服务 : 010-62776969,，c-service(@tup. tsinghua. edu. cn 
质量 反馈 . 010-62772015, zhiliang(@tup. tsinghua. edu. cn 
课件 下 载 : http://www. tup. com. cn,010-62795954 


编 : 100084 
购 : 010-62786544 


下 于 


中 | 守 次 汽 计 以 贞 并 


: 全 国 新 华 书店 

: 185mmx260mm 印 张 ， 22 = 
: 2015 年 5 月 第 1 版 印 
: 1~— 000 

.00 元 


: 533 千 字 
: 2015 年 5 月 第 1 次 印刷 


学 湾 


讲台 杰 沁 矢 江 加 


上 
En 
El 


: 044373-0] 


六 出 


随 着 我 国 改革 开放 的 进一步 深化 ,高 等 教育 也 得 到 了 快速 发 展 ,各 地 高 校 紧密 结合 地 方 
经 济 建设 发 展 需要 ,科学 运用 市 场 调 节 机 制 ,加 大 了 使 用 信息 科学 等 现代 科学 技术 提升 、 改 
造 传统 学 科 专 业 的 投入 力度 ,通过 教育 改革 合理 调整 和 配置 了 教育 资源 ,优化 了 传统 学 科 专 
业 ,积极 为 地 方 经 济 建设 输送 人 才 ,为 我 国 经 济 社会 的 快速 ,健康 和 可 持续 发 展 以 及 高 等 教 
育 日 号 的 改 于 发 展 做 出 了 巨大 页 献 。 但 是 ,高 等 教育 质量 还 宕 要 进一步 提 融 以 适应 经 济 社 
会 发 展 的 需要 ,不 少 高 校 的 专业 设置 和 结构 不 尽 合 理 , 教 师 队 伍 整 体 素 质 吸 待 提高 ,人 才 培 
养 模 式 ,教学 内 容 和 方法 需要 进一步 转变 ,学 生 的 实践 能 力 和 创新 精神 咀 竺 加强。 

教育 部 一 直 十 分 重视 高 等 教育 质量 工作 。2007 年 1 月 ,教育 部 下 发 了 《关于 实施 高 等 
学 校本 科教 学 质量 与 教学 改革 工程 的 意见 》, 计 划 实 施 “ 高 等 学 校本 科教 学 质量 与 教学 改革 
工程 (简称 “质量 工程 ”) ,通过 专业 结构 调整 ,课程 教材 建设 ,实践 教学 改革 、 教 学 团队 建设 
等 多 项 内 容 , 进 一 步 深 化 高 等 学 校 教 党 改革 ,提高 人 才 培 养 的 能 力 和 水 平 ,更 好 地 满足 经 济 
社会 发 展 对 高 素质 人 才 的 需要 。 在 贯彻 和 落实 教育 部 “质量 工程 ?的 过 程 中 ,各 地 高 校 发 挥 
师资 力量 强 .办 学 经 验 丰 亩 .教学 资源 充裕 等 优势 ,对 其 特色 专业 及 特色 诛 程 ( 群 ) 加 以 规划 、 
整理 和 总 结 ,更 新 教学 内 容 .改革 课程 体系 ,建设 了 一 大 批 内 容 新 .体系 新 .方法 新 .手段 新 的 
特色 课程 。 在 此 基础 上 ,经 教育 部 相关 教学 指导 委员 会 专家 的 指导 和 建议 ,清华 大 学 出 版 社 
在 多 个 领域 精 选 各 高 校 的 特色 课程 ,分 别 规划 出 版 系列 教材 ,以 配合 “质量 工程 ”的 实施 , 满 
足 各 高 校 教 学 质量 和 教学 改革 的 需要 。 

为 了 深入 贯彻 落实 教育 部 4 关于 加 强 高 等 学 校本 科教 学 工作 ,提高 教学 质量 的 者 干 意 
见 》 精 神 , 紧 密 配 合 教 育 部 已 经 启动 的 “高 等 学 校 教学 质量 与 教学 改革 工程 精品 课程 建设 工 


育 
作 ”, 在 有 关 专 家 、 教 授 的 倡议 和 有 关 部 门 的 大 力 支 持 下 ,我 们 组 织 并 成 立 了 “清华 大 学 出 版 
社 教材 编审 委员 会 "(以 下 简称 “ 编 委 会 ”), 冒 在 配合 教育 部 制定 精品 课程 教材 的 出 版 规划 ， 
讨论 并 实施 精品 课程 教材 的 编写 与 出 版 工作 。“ 编 委 会 ”成 员 宵 来 目 全 国 各 类 高 等 学 校 教 学 
与 科 人 饶 第 一 线 的 骨干 教师 ,其 中 许多 教师 为 各 校 相 关 院 、 系 主管 教学 的 院 长 或 系 主任 。 
按照 教育 部 的 要 求 ,“ 编 委 会 ”一 公认 为 ,精品 课程 的 建设 工作 从 开始 就 要 坚持 高 标准 、 
严 要 求 , 处 于 一 个 比较 高 的 起 点 上 。 精 品 课程 教材 应 该 能 够 反映 各 高 校 教 学 改革 与 课程 建 
设 的 需要 ,要 有 特色 风格 有 创新 性 (新 体系 、 新 内 容 、 新 手段 ,新 思路 ,教材 的 内 容 体 系 有 和 较 
高 的 科学 创新 、 技 术 创 新 和 理念 创新 的 含量 ) ,先进 性 (对 原 有 的 学 科 体 系 有 实质 性 的 改革 和 
发 展 , 顺 应 并 符合 21 世纪 教学 发 展 的 规律 ,代表 并 引领 诛 程 发 展 的 趋势 和 方 回 )、 示范 性 ( 教 
材 所 体现 的 课程 体系 具有 较 广 泛 的 辐射 性 和 示范 性 ) 和 一 定 的 前 有 瞻 性。 教材 由 个 人 申报 或 
各 校 推 荐 (通过 所 在 高 校 的 “ 编 委 会 ”成 员 推 荐 ) ,经 “ 编 委 会 ”认真 评审 ,最 后 由 清华 大 学 出 版 
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社 审 定 出 版 。 

目前 ,针对 计算 机 类 和 电子 信息 类 相关 专业 成 立 了 两 个 “ 编 委 会 ”>, 即 “清华 大 学 出 版 社 
计算 机 教材 编审 委员 会 ”和 “清华 大 学 出 版 社 电 子 信 息 教材 编审 委员 会 "。 推 出 的 特色 精品 
教材 包括 : 

(1) 21 世纪 高 等 学 校规 划 教 材 。 计算机 应 用 一 一 高 等 学 校 各 类 专业 ,特别 是 非 计 算 机 
专业 的 计算 机 应 用 类 教材 。 

(2) 21 世纪 高 等 学 校规 划 教 材 。 计算 机 科学 与 技术 一 一 高 等 学 校 计 算 机 相关 专业 的 
教材 。 

(3) 21 世纪 高 等 学 校规 划 教 材 。 电子 信息 一 一 高 等 学 校 电子 信息 相关 专业 的 教材 。 

(4) 21 世纪 高 等 学 校规 划 教 材 ， 软件 工程 一 一 高 等 学 校 软件 工程 相关 专业 的 教材 。 

(5) 21 世纪 高 等 学 校规 划 教 材 。 信 息 管 理 与 信息 系统 。 

(6) 21 世纪 高 等 学 校规 划 教 材 。 财经 管理 与 应 用 。 

(7) 21 世纪 高 等 学 校规 划 教 材 ， 电子 商务 。 

(8) 21 世纪 高 等 学 校规 划 教 材 ， 物 联网 。 


清华 大 学 出 版 社 经 过 三 十 多 年 的 努力 ,在 教材 尤其 是 计算 机 和 电子 信息 类 专业 教材 出 
版 方面 树立 了 权威 品牌 ,为 我 国 的 高 等 教育 事业 做 出 了 重要 贡献 。 清 华 版 教材 形成 了 技术 
准确 内 容 严谨 的 独特 风格 ,这 种 风格 将 延续 并 反映 在 特色 精品 教材 的 建设 中 。 


清华 大 学 出 版 社 教材 编审 委员 会 
联系 人 : 魏 江 江 


E-mail : weijj(% tup. tsinghua. edu. cn 


1. 计算 机 学 科 的 课程 体系 


一 个 学 科 的 高 等 教育 必须 要 有 人 先进 的 教学 理念 和 完整 的 读 程 体系 ,同时 与 该 学 科 的 发 
展 也 是 紧密 相关 的 。 谈 到 计算 机 科学 与 技术 学 科 的 高 等 教育 ,就 要 提 到 两 个 国际 组 织 ,一 是 
IEEE ,二 是 ACM。IEEE 的 全 称 是 Institute of Electrical and Electronics Engineers, 即 美 
国电 气 与 电子 工程 师 学 会 ,是 美国 的 一 个 工程 技术 和 电子 专家 的 组 织 , 主 要 致力 于 电气 、 电 
工程 以 及 和 信息 拉 术 与 科学 有 关 的 领域 的 开发 和 人 研究 。ACM 的 全 称 是 
Association for Computing Machinery, 即 美国 计算 机 协会 ,是 一 个 致力 于 工程 技术 和 应 用 
领域 中 信息 拉 术 科学 教育 的 国际 计算 机 组 织 。 国 际 上 最 系统 、 最 有 影响 的 计算 机 专业 的 教 
学 计划 当 属 IEEE-CS(IEEE 属 下 的 计算 机 学 会 ) 与 ACM 各 时 期 发 表 的 指导 性 计划 ,它们 对 
计算 机 学 科教 育 方面 的 研究 既 全 面 又 深入 。 其 中 ,影响 较 大 的 有 ACM68 课程 体系 、 
ACM78 诛 程 体系 、IEEE-CS83 教程 和 计算 机 教程 1991( 人 简称 CC1991) 等 。ACM68 诛 程 体 
系 和 ACM78 课程 体系 是 基于 课程 定义 的 。CC1991 是 IEEE-CS 和 ACM 合作 推出 的 , 它 将 
更 多 的 科学 原理 引入 计算 机 学 科 的 教学 计划 设计 中 ,给 出 了 计算 机 学 科 的 科学 定义 ,解答 了 
计算 机 等 科教 育 界 多 年 来 存在 的 疑问 和 争论 ,同时 它 及 用 了 知识 领域 (Knowledge Area) 、 
知识 单元 (Knowledge Unit) 和 知识 点 (Topic) 来 描述 计算 机 学 科 的 核心 知识 体系 ,引导 人 们 
去 考虑 学 科 的 本 质 和 核心 ,从 而 制定 出 既 符 合 各 日 培养 目标 又 从 合掌 科 发 展 的 课程 体系 。 
1998 年 秋 ,IEEE-CS 和 ACM 又 成 立 了 计算 机 教程 2001 (Computing Curricula 2001， 
CC2001) 联 合 工 作 组 ,并 于 2001 年 发 布 了 计算 机 教程 2001( 即 CC2001)。CC2001 较 好 地 反 
映 了 计算 机 学 科目 1991 年 的 发 展 及 这 个 时 期 社会 发 展 给 学 科教 育 市 来 的 影响 。 它 除了 继 
承 CC1991 的 知识 描述 体系 外 ,又 增加 了 各 级 课程 的 设计 方法 ,并 给 出 了 一 些 推 荐 课程 的 
白 述 。 
从 我 国 的 计算 机 学 科 的 教育 看 ,1999 年 前 ,我 国 " 计 算 机 专业 ?主要 被 分 为 计算 机 及 应 
用 和 计算 机 软件 两 个 专业 。 从 1999 年 起 ,按照 宽 口 径 培 养 人 才 的 需要 ,这 两 个 专业 被 合并 
为 一 个 专业 , 即 计 算 机 科学 与 技术 。 我 国 各 高 校 计 算 机 科学 与 技术 专业 的 教学 计划 是 在 中 
国 计 算 机 学 会 教育 专业 委员 会 和 全 国 高 等 学 校 计 算 机 教育 钱 究 会 的 指导 下 制定 的 。 
CC2001 推出 后 ,中 国 计 算 机 学 会 教育 业 委员 会 和 全 国 高 于 学校 计算 机 教育 研究 会 给 巴 
了 密切 的 关注 ,在 对 CC2001 进行 跟踪 研究 的 基础 上 ,结合 我 国 计 算 机 学 科 的 发 展现 状 和 我 
国 计 算 机 教育 的 具体 情况 ,提出 了 一 个 适合 我 国 计 算 机 学 科教 育 的 课程 体系 , 即 中 国 计 算 机 
科学 与 技术 学 科教 程 CCC2002。 
近 些 年 , 随 者 计算 机 技术 的 高 速 发 展 和 在 各 行业 应 用 的 普及 ,社会 对 计算 机 学 科 领 域 人 
才 的 需求 分 工 越 来 越 细 ,计算 机 学 科 的 高 等 教育 也 发 生 了 变化 ,各 高 校 在 计算 机 学 科 先 后 设 
置 了 软件 工程 .网 络 工程 .电子 商务 .信息 安全 等 不 同 的 专业 或 方向 ,以 满足 社会 对 不 同 专业 
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人 才 的 需求 。 从 2001 年 开始 ,IEEE-CS 和 ACM 把 计算 机 学 科 细 分 为 “计算 机 科学 CS”、 
“计算 机 工程 CE”、“ 信 息 系统 IS”、“ 信 息 工 程 ITT” 以 及 “软件 工程 SE”。2005 年 I[EEE-CS 联 
合 ACM 发 布 了 CC2005,2008 年 发 布 了 CS2008 版 本 (临时 版 本 ),2012 年 2 月 开始 颁布 
CS2013。CS2013 重新 定义 计算 机 科学 的 知识 模块 ,考量 计算 机 科学 教程 的 要 素 , 提 出 一 个 
深 程 体系 样本 ,发 展 一 系列 教学 内 容 , 尝 试 厦 分别 从 系统 和 软件 开发 两 个 方面 ,总 结 基 础 原 
理 与 方法 策略 ,沉淀 计算 机 学 科 的 专业 核心 知识 。 其 中 对 于 计算 机 体系 结构 与 组 织 (AR) 知 
识 模块 ,强化 多 核 并 行 .虚拟 机 支持 ,供电 限制 ,强调 CAD 工具 的 应 用 。 

我 国教 育 部 高 等 学 校 计算 机 科学 与 搁 术 教学 指 守 委员 会 在 分 析 人 钱 究 计算 机 学 科 国 内 外 
发 展 和 社会 需求 的 基础 上 ,发 布 了 《计算 机 科学 与 搁 术 专业 发 展 战 略 人 研究 报告 》, 提 出 了 适应 
我 国 计 算 机 科学 与 技术 专业 高 等 教育 的 教学 规范 。 这 一 教学 规范 对 于 我 国 各 高 校 在 计算 机 
科学 与 技术 专业 人 才 培 养 目标 的 确定 和 课程 体系 的 制定 等 方面 都 给 出 了 指导 性 建议 。 


2. 为 什么 要 学 习 本 课程 


对 于 学 习 汽 车 工程 专业 的 学 生来 讲 , 无 论 是 搞 汽 车 外 形 设 计 , 还 是 研究 汽车 的 发 动机 ， 
都 必须 对 汽车 的 组 成 和 工作 原理 有 基本 的 了 解 。 同 样 ,对 于 计算 机 专业 的 学 生来 讲 , 了 解 和 
掌握 计算 机 的 组 成 及 工作 原理 也 是 必需 的 。 

目前 很 多 高 校 计算 机 专业 的 学 生 在 不 同 程度 上 有 着 重 软 轻 硬 的 思想 。 这 主要 有 两 个 方 
面 的 原因 : 一 方面 , 近 十 年 来 , 随 着 各 行业 管理 信息 系统 建设 的 发 展 , 社 会 对 软件 工程 师 ( 尤 
其 是 应 用 软件 工程 师 ) 的 需求 越 来 越 大 ,从 事 软 件 设计 、 软 件 编程 .软件 维护 等 方面 的 人 员 成 
为 了 IT 人 公司、 金融, 政府 及 企 事业 单位 紧缺 的 人 才 ; 男 一 方面 ,相对 软件 课程 来 讲 , 人 硬件 课 
程 学 起 来 比较 村 煤 , 没 有 像 语 言 类 软件 课程 有 看 学 完 就 能 使 用 的 立 牢 见 影 的 效果 。 例 如 ,很 
多 高 校 都 开设 了 “Web 程序 设计 ”课程 ,学 生 学 完 该 课程 后 ,就 能 设计 网 站 或 制作 网 页 ,学生 
当然 很 感 兴趣 。 

实际 上 ,在 计算 机 系统 中 ,计算 机 便 件 和 计算 机 软件 是 相关 联 的 两 个 部 分 , 便 件 为 软件 
的 运行 提供 了 一 个 平台 ,要 编制 高 质量 的 软件 程序 ,对 计算 机 有 一 个 整体 的 了 解 是 十 分 重要 
的 。 对 系统 软件 程序 员 来 讲 , 系 统 软件 是 和 硬件 紧密 相关 的 ,系统 软件 程序 员 必 须 对 机 器 级 
人 硬件 十 分 了 解 , 才 有 可 能 编制 出 适应 某 一 机 上 需 硬 件 的 系统 软件 。 对 应 用 软件 程序 员 来 讲 , 对 
机 天 便 件 的 了 解 有 助 于 他 们 编制 更 高 效 和 优化 的 程序 。 例 如 ,阵列 计算 机 、 并 行 处 理 计算 
机 、 多 处 理 占 以 及 近 两 年 出 现 的 基于 多 处 理 需 的 计算 机 系统 ,对 并 行 计 算 提 供 了 一 个 文 持 的 
平台 。 对 程序 员 来 讲 , 对 计算 机 硬件 实现 的 并 行 处 理 技 术 的 了 解 , 有 助 于 他 们 充分 利用 并 行 
计算 环境 ,编制 高 效 的 并 行程 序 。 

最 重要 的 ,前 面 已 经 讲 到 ,计算 机 学 科 的 教育 有 一 个 完整 的 科学 体系 ,课程 的 设置 也 是 
围绕 这 一 体系 来 进行 的 。 这 一 科学 体系 注重 培养 学 生 的 科学 思维 能 力 、 创 新 实践 能 力 、 人 研究 
和 应 用 能 力 以 及 继续 学 习 的 能 力 。 作 为 学 生来 讲 , 应 该 认真 学 好 每 一 门 课程 ,掌握 计算 机 学 
科 领 域 所 要 求 的 各 方面 知识 。 只 有 这 样 , 才 能 对 本 学 科 有 一 个 完整 的 理解 ,才能 成 为 真正 合 
格 的 计算 机 科学 与 技术 专业 的 学 生 ， 

计算 机 组 织 与 结构 是 计算 机 专业 一 门 重要 的 专业 基础 课程 ,也 是 CC2001、CC2005、 
CS2013 以 及 我 国 计 算 机 科学 与 技术 专业 规范 中 确定 的 一 门 核心 课程 , 它 对 于 学 生 建 立 计 算 
机 整 机 概念 ,了 解 计算 机 系统 的 基本 组 成 .结构 和 工作 原理 ,从 而 对 本 学 科 其 他 知识 领域 和 


ll 


本 


知识 单元 的 内 容 有 更 深刻 的 理解 有 者 非常 重要 的 意义 。 
3. 教材 内 容 的 组 织 


本 教材 在 内 容 的 组 织 上 ,主要 按照 我 国教 育 部 高 等 学 校 计 算 机 科学 与 技术 教学 指导 委 
员 会 制定 的 “计算 机 科学 与 技术 专业 规范 ?中 的 知识 领域 "CS-AR 计算 机 体系 结构 与 组 织 ” 
所 要 求 的 内 容 进 行 编写 。 同 时 , 紧 跟 IEEE-CS/ACM 颁布 的 CS2013 ,对 计算 机 体系 结构 和 
组 织 (AR) 知 识 模块 的 内 容 做 了 适当 调整 。 各 章节 涵盖 的 知识 单元 主要 包括 

AR2 数据 的 机 顺 级 表示 (核心 学 时 ): 第 2 章 

AR3 汇编 级 机 需 组 织 ( 核 心 学 时 ): 第 3 章 

AR4 存储 系统 组 织 与 结构 (核心 学 时 ): 第 4 章 

AR5 接口 和 通信 (核心 学 时 ): 第 5 章 、 第 6- 

AR6 功能 组 织 ( 核 心 学 时 ): 第 7 章 

AR7 多 处 理 和 体系 结构 (核心 学 时 ): 第 8 章 

本 书 共 分 8 章 , 其 中 ， 

第 1 草 首 先 介 绍 计 算 机 的 发 展 历 程 ; 然后 介绍 按 IEEE 分 类 法 的 计算 机 的 分 类 ; 最 后 ， 
作为 本 书 的 一 个 “ 序 ”, 概 括 性 地 介绍 了 计算 机 的 硬件 组 成 及 计算 机 的 层次 结构 。 

第 2 草 站 和 完 介 绍 二 进 制 等 基本 的 进位 计数 制 ; 再 介绍 在 计算 机 中 是 如 何 对 我 们 日 常 处 
理 的 数值 数据 和 非 数值 数据 (主要 包括 字符 、 汉字 等 ) 进 行 二 进 制 编码 表示 的 ; 然后 介绍 站 
值 数据 在 计算 机 中 的 二 进 制 运算 方法 和 实现 ; 最 后 介绍 对 计算 机 中 的 数据 在 传递 过 程 中 产 
生 的 差错 进行 检测 而 使 用 的 数据 校 验 码 。 

第 3 章 首 先 介 绍 计 算 机 中 汇编 级 指令 的 格式 .地址 结构 ; 然后 介绍 指令 及 操作 数 的 寻 
址 方式 ,以 及 指令 的 种 类 和 功能 、 典 型 指令 系统 的 组 成 等 ; 最 后 对 精简 指令 系统 RISC 进行 
介绍 。 

第 4 章 首 先 介 绍 存储 带 的 组 织 、 分 类 和 分 层 结 构 ; 然后 介绍 计算 机 主 存储 器 的 组 成 与 
工作 原理 ; 最 后 介绍 提高 存储 系统 性 能 的 交叉 存储 技术 .高速 缓冲 存储 器 及 虚拟 存储 器 技 

第 5 章 首 先 介 绍 计 算 机 输入 输出 系统 的 组 成 ; 然后 对 计算 机 输入 输出 的 控制 方式 进行 
详细 讨论 ,包括 程序 控制 方式 .中断 控 制 方式 `.DMA 控制 方式 和 通道 控制 方式 等 ; 最 后 介绍 
计算 机 存储 设备 一 一 磁盘 系统 以 及 由 磁盘 阵列 组 成 的 RAID 技术 。 

第 6 章 首 先 讲 述 计算 机 内 部 各 部 件 之 间 的 总 线 互 连结 构 ,介绍 总 线 的 基本 概念 .总线 的 
类 别 和 总 线 的 控制 方式 等 ; 然后 列举 几 种 现代 计算 机 中 第 用 的 ISA、PCI 等 总 线 标准 ; 最 后 
介绍 几 种 目前 在 计算 机 中 常用 的 USB IEEE 1394 和 SCSI 等 外 部 总 线 接 口 标准 。 

第 7 章 首 先 介 绍 CPU 的 功能 与 组 成 ; 再 通过 一 个 模型 机 的 例子 说 明了 CPU 的 指令 周 
期 及 执行 指令 的 过 程 ; 然后 讨论 了 CPU 控制 部 件 设 计 的 硬 布线 设计 法 和 微 程序 设计 法 两 
种 主要 方法 ; 最 后 以 Intel 公司 的 CPU 产品 为 例 , 介 绍 了 典型 CPU 的 发 展 。 

第 8 章 首 先 介 绍 计算 机 系统 的 并 行 性 概念 ,对 计算 机 中 使 用 的 时 间 重 又 .资源 重复 和 资 
源 共 于 等 提高 并 行 性 的 技术 途径 进行 概要 性 的 介绍 ; 然后 分 别 介 绍 现 代 计 算 机 普遍 采用 的 
流水 线 技术 和 多 处 理 机 技术 等 并 行 处 理 技术 ; 最 后 对 近 些 年 发 展 起 来 且 应 用 非常 广泛 的 机 
群 系统 .高 性 能 计算 和 多 核 处 理 器 进行 讨论 。 
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4. 教材 的 主要 特色 


结合 计算 机 学 科教 育 重 基础 、 重 发 展 、 重 创新 的 要 求 ,本 教材 在 内 容 组 织 和 编写 上 有 以 
站 特点 : 

(1) 首先 为 学 生 建 立 整 机 的 概念 。 在 第 1 章 , 通 过 将 学 生日 第 所 熟悉 的 实际 PC 与 计算 
机 的 基本 组 成 部 件 进行 对 比 , 使 学 生 对 计算 机 整 机 的 组 成 有 一 个 初步 的 认识 ,对 组 成 计算 机 
和 统 的 主要 部 件 的 基本 功能 有 一 个 初步 的 了 解 。 

(2) 按照 从 整 机 到 部 件 自 上 而 下 的 思想 进行 课程 内 容 的 组 织 , 使 学 生 在 每 一 章节 的 
习 中 ,都 清楚 所 学 章节 的 内 容 与 整 机 的 关联 。 同 时 对 计算 机 组 织 与 结构 的 各 种 概念 ,思想 
原理 等 进行 重点 讲述 。 

(3) 围绕 各 草 方 的 内 容 , 穿 插 了 了 一些“ 知识 拓展 ”, 介 绍 一 些 计 算 机 系统 方面 的 相关 知识 
以 及 计算 机 发 展 的 新 技术 、 新 知识 等 。 如 在 第 1 曹 穿插 了 知识 拓展 一 一 摩尔 定律 ,计算 机 的 
性 能 评测 ; 在 第 2 章 穿 插 了 知识 拓展 一 一 二 进 制 的 游戏 ; 在 第 3 章 穿 插 了 知识 拓展 一 一 
x86CPU 指令 系统 的 扩展 指令 集 ; 在 第 4 草 罕 捅 了 知识 拓展 一 一 新 型 动态 存储 冀 SDRAM、 
DDR、DDR2 和 DDR3 , 必 片 的 封装 技术 ; 在 第 5 曹 穿 插 了 知识 拓展 一 一 便 盘 接口 ,网络 存 储 
系统 ; 在 第 6 草 穿 插 了 知识 折 展 一 一 前 端 总 线 , 串 行 传输 还 是 并 行 传输 ; 在 第 7 章 穿 插 了 知 
识 拓 展 一 一 GPU 和 CPU; 在 第 8 曹 穿插 了 知识 折 展 一 一 超级 计算 机 天河” 二 号 ; 能 使 学 
生 开 拓 视 野 ,增长 知识 。 

(4) 为 帮助 学 生 更 好 地 学 习 本 课程 ,专门 建设 了 计算 机 组 织 与 结构 课程 教学 网 站 。 网 
站 的 课程 介绍 部 分 介绍 了 本 课程 的 教学 大 纲 .教学 的 组 织 和 安排 等 : 课程 教学 部 分 提供 了 
按 课 等 教学 单元 进行 组 织 的 教学 内 容重 点 难点 等 ; 教学 质 源 部 分 为 学 生 提 供 了 本 课程 的 
数学 课件 和 参考 资料 ; 学 习 讨 论 部 分 提供 了 一 个 学 生 与 教师 以 及 学 生 与 学 生 之 间 的 交流 平 
台 等 。 男 外 ,教学 管理 部 分 还 进一步 为 教师 提供 了 一 个 学 生 管理 ,作业 管理 ,考试 管理 和 成 
颖 管理 等 的 平台 ,教师 可 以 通过 本 课程 网 站 更 好 地 组 织 本 课程 的 教学 。 


5. 教材 的 学 时 安排 
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本 教材 共 分 8 章 , 第 1 一 7 草 全 面 讲 述 了 单 处 理 机 系统 的 便 件 组 织 和 结构 ,包括 计算 机 
中 的 数据 表示 和 运算 .汇编 级 机 璐 组织 .存储 系统 的 组 织 与 结构 .输入 输出 系统 的 组 织 、 
CPU 的 组 织 与 结构 及 总 线 和 接口 等 ; 第 8 草 介绍 了 现代 并 行 处 理 机 系统 的 一 些 主流 技术 
和 体系 结构 ,包括 流水 线 技术 、 多 人 处理 机 系统 、 机 群 系 统 和 多 核 处 理 右 等 。 本 教材 建议 总 学 
时 为 60 一 80 和 学 时 ,各 局 校 按照 计算 机 专业 诛 程 体系 中 诛 程 设置 和 讲授 内 容 的 不 同 可 以 灵活 
调整 。 

本 教材 由 徐 苏 担任 主编 ,日 小 明 、 张 乐 、 于 海 去 为 副 主编 , 李 问 军 、 林 振 麻 等 参 编 并 帮助 


编 者 
2015 年 2 月 
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从 1946 年 第 一 台电 子 计算 机 ENIAC 的 诞生 到 现在 ,计算 机 的 发 展 已 走 过 了 半 个 多 世 
纪 的 历程 。 在 这 半 个 多 世纪 的 时 间 里 ,人 类 在 计算 机 技术 领域 所 取得 的 成 就 几乎 是 其 他 任 
何 技术 领域 都 无 法 比拟 的 。 单 从 衡量 计算 机 性 能 的 重要 指标 之 一 一 一 运算 速度 来 看 ， 
ENIAC 的 运算 速度 是 每 秒 5000 次 ,而 现代 计算 机 的 运 自 速度 已 超过 每 秒 万 亿 次 水 平 , 整 整 
提高 了 10" 倍 以 上 ， 

本 章 首先 介绍 计算 机 的 发 展 历程 ,其 中 ,器 件 技 术 是 计算 机 发 展 的 核心 ; 然后 介绍 按 
IEEE 的 分 类 法 的 计算 机 分 类 和 按照 计算 机 的 综合 性 能 指标 的 计算 机 分 类 ; 接着 介绍 了 计 
算 机 的 主要 性 能 指标 ; 最 后 ,作为 本 书 的 一 个 “ 序 ”, 概 括 性 地 介绍 计算 机 的 硬件 组 成 及 计算 
机 的 层次 结构 。 


1.1 计算 机 的 发 展 历 程 


计算 机 技术 的 飞速 发 展 离 不 开 其 所 依赖 的 硬件 技术 的 发 展 。 在 计算 机 领域 ,人 们 普遍 
把 计算 机 的 发 展 划分 为 5 代 , 而 这 一 划分 所 依据 的 正 是 计算 机 所 使 用 的 基本 元 器 件 。 可 以 
说 ,硬件 技术 是 计算 机 发 展 的 重要 物质 基础 和 技术 保障 。 


1. 第 专 代 : 机 械 时 代 


,商业 .航海 和 天 文学 都 提出 了 许多 复杂 的 计算 问题 ,很 多 人 都 关心 计 
,于 是 人 们 开始 研究 和 设计 具有 计算 能 力 


随 看 科学 的 发 展 
算 工 具 的 发 展 ,和 希望 借助 计算 工具 提高 计算 的 效率 
的 “计算 机 需 (CCalculating Machine)”。 

世界 上 第 一 台 以 齿轮 驱动 的 计算 机 器 应 该 是 由 德国 人 Wilhelm Schickard 教授 于 1623 
年 设计 并 建造 的 计算 钟 CCalculating Clock) ,如 图 1-1 所 示 。 但 它 并 没有 得 到 人 们 的 关注 ， 
因为 Wilhelm Schickard 在 发 明 该 机 各 不 久 就 死 于 疾病 ，。 

1642 年 ,法 国 数学 家 ,物理 学 家 帕斯卡 (Blaise Pascal) 在 年 仅 19 岁 时 发 明了 一 台 机 械 
加 法 天 Pascaline( 见 图 1-2) ,以 帮助 其 父亲 收 税 时 计算 使 用 。 由 于 成 本 和 计算 准确 度 问 题 ， 
Pascaline 仅 售 出 了 50 台 。Pascaline 由 一 套 8 个 可 旋转 的 齿轮 系统 组 成 ,只 能 进行 加 法 运 
算 ,实现 目 动 进位 ,并 配置 一 个 可 显示 计算 结果 的 和 窗口。 虽然 现在 汽车 的 仪表 盘 的 显示 已 数 
字 化 ,但 其 中 里 程 表 中 仍然 采用 了 与 Pascaline 相 类 似 的 机 械 工 作 原 理 。 
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1-1 Calculating Clock 


1670 年 ,德国 数学 家 .哲学 家 汪 布 尼 效 (Gottfried Leibniz) 改 进 卫 Pascaline, 发 明了 一 
个 被 称 为 步 进 式 计算 伪 (Stepped Reckoner) 的 计算 敌 , 它 具有 加 、 减 、 乘 、 除 4 种 运算 功能 。 
值得 一 提 的 是 ,虽然 在 Stepped Reckoner 上 使 用 的 是 十 
进 制 数 , 但 莱 布 尼 效 是 首先 提出 使 用 二 进 制 计 算 的 科学 
家 ,这 为 现代 计算 机 更 定 了 基础 。 但 是 ,所 有 的 这 些 计 算 
设备 或 工具 都 不 能 进行 编程 计算 ,也 没有 存储 器 ,计算 过 
程 | 

尽管 像 Pascaline 这 类 计算 冀 一 二 使 用 到 20 世纪 ， 
但 在 1 19 世纪 时 就 已 经 开始 出 现 了 新 型 计算 工具 的 设计 。 
这 其 中 ,最 引 人 注 目的 是 由 英国 数学 家 巴 贝 奇 (Charles 
Babbage) 于 1822 年 设计 的 差分 机 (Difference Engine ) 
( 见 图 1-3)。 这 全 机 带 能 够 计算 数 表 , 如 对 数 表 。 由 - 
当时 数 表 在 航海 中 的 重要 性 ,他 得 到 也 国政 府 的 资助 。 
1833 年 ,Charles Babbage 又 在 差分 机 的 基础 上 设计 了 
一 种 多 用 途 的 机 带 , 称 为 分 析 机 (Analytical Engine ) 。 
分 析 机 已 经 具备 了 执行 任意 类 型 的 数学 运算 的 能 力 , 同 时 还 包含 了 现代 计算 机 的 许多 部 件 : 
一 个 算术 处 理 部 件 进行 计算 工作 (Babbage 称 之 为 运算 迎 辑 部 件 一 一 mil) ,一 个 存储 天 
(store) ,以 及 输入 输出 设备 。 可 以 说 分 析 机 已 经 具有 现代 计算 机 的 概念 ,但 因 当 时 的 技术 
条 件 限 制 而 未 能 制造 完成 。 

1888 年 ,美国 统计 学 家 霍 勒 瑞 斯 (Herman Hollerith) 为 人 口 统计 局 建造 了 第 一 台 机 电 
式 穿孔 卡 系统 一 一 制 表 机 , 它 是 将 机 械 统计 原 理 与 信息 日 动 比较 和 分 析 方 法 结合 起 来 的 统 
计 分 析 机 ,使 美国 统计 人 口 所 需 的 时 间 从 过 去 的 8 年 缩短 为 2 年 。 霍 勒 瑞 斯 在 1896 年 创办 
了 制 表 机 公司 ,1911 年 他 又 组 建 了 一 家 计算 制 表 记录 公司 ,该 公司 到 1924 年 改名 为 国际 疝 
用 机 天 公司 ,这 就 是 举世 闻名 的 美国 IBM 公司 。 

1938 年 ,德国 工程 师 朱 斯 (Konrad Zuse) 成 功 制造 了 第 一 台 二 进 制 计算 机 Z-1, 它 是 一 
种 纯 机 械 式 的 计算 闻 置 , 它 的 机 械 存 储 甫 能 存储 64 位 数 。 此 后 他 继续 研制 了 Z 系列 计算 

机 ,其 中 2Z-3 型 计算 机 是 世界 上 第 一 全 通用 程序 控制 的 机 电 计 算 机 ， 它 使 用 了 2600 个 继 电 
化 ,采用 二 进 制 进行 运算 , 运 自 一 次 加 法 只 用 0. 3s, 如 图 1-4 所 示 。 
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1944 年 ,美国 麻 省 理工 学 院 科 学 家 芯 肯 pg 
CR 
四 二 信人 OC 


(Howard Aiken) 研 制 成 功 了 一 人 台 通 用 型 机 电 计算 
| | 六 甘 村 本 多 

机 MARK- ,如 图 1-5 所 示 , 它 使 用 了 3000 多 个 ET 
继电器 ,总 共 由 15 万 个 元 件 组 成 ， 各 种 导线 总 长 达 
到 800km 以 上 。1947 年 , 基 肯 又 研制 出 运算 速度 
更 快 的 机 电 计 算 机 MARK-I 。 

至 此 在 计算 机 技术 上 存在 看 两 条 发 展 道 路 ,一 
是 各 种 机 械 式 计算 机 的 发 展 道路 ; 二 是 采用 继 电 顺 
作为 计算 机 电路 元 件 的 发 展 道路 。 后 来 建立 在 电 生生 
了 于 管 和 品 体 管 等 电子 元 件 基 础 上 的 电子 计算 机 正 1-4 Z-3 型 计算 机 
是 受益 于 这 两 条 发 展 道路 的 。 
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说 明 。 六 上 图 1-1 一 


1-5 的 图 片 取 目 http:/ . WWW,. computersciencelab,. COITL 。 


算 机 


电子 计算 机 区 别 于 机 械 式 计算 机 最 主要 的 特点 是 使 用 了 电子 元 右 件 作为 其 存储 和 控制 
部 件 ,计算 机 能 够 依靠 电子 元 一 件 目 动 完成 计算 。 电 了 于 计算 机 发 展 阶 段 也 正 是 以 其 所 来 用 
的 基本 电子 元 髓 件 及 技术 作为 划分 的 基础 ,如 表 1-1 所 示 。 
表 1-1 计算 机 的 发 展 阶 段 
所 采用 的 技术 担 型 速记 


1946 一 1957 年 于 管 几 万 次 
1958 一 1964 年 十 几 到 几 十 万 次 


] 
2 


1965 一 1971 年 小 规 杭 此 用 村 
1972 一 1977 年 大 规模 集成 电路 干 万 次 
4 1978 一 1991 年 超 路 亿 次 
1991 一 了 大 规模 集成 路 十 亿 次 


从 表 1-1 中 可 以 看 出 ,第 一 代 计 算 机 采用 的 主要 元 骨 件 是 电子 管 ( 又 称 真 空 管 ), 它 是 以 
1946 年 诞生 的 世界 上 第 一 台电 子 计 算 机 ENIAC 为 标志 的 ,如 图 1-6 所 示 。 


ES 


计算 机 组 织 与 结构 


电子 数字 积分 句 和 计算 颖 (Electronic Integrator And Calculator, ENIAC) 是 由 美国 宾 
夕 法 尼 亚 大 学 电子 工程 系 的 John Mauchly 和 J]. Presper Eckert 共同 领导 设计 的 。 当 时 正 
值 第 二 次 世界 大 战 期 间 , 美 国 军 方 的 弹道 研究 实验 室 BRL 在 提供 导弹 发 射 数 据 表 的 精确 性 
和 及 时 性 上 遇 到 了 困难 ,和 盏 方 需 鹿 佣 几 昌 人 进行 人 工 计 算 。 当 得 知 使 用 电子 计算 机 可 以 将 
导弹 发 射 数据 表 的 计算 时 间 从 几 天 缩短 为 儿 分 钟 时 , 军 方 决定 资助 ENIAC 项 目 。ENIAC 
项 目 于 1943 年 开始 正式 局 动 ,1946 年 2 月 完成 。 实 际 建造 出 来 的 机 各 是 一 个 庞然大物 ,其 
占 地 面积 为 170m ,总 重量 达 30t。 机 絮 中 约 有 18 000 支 电 子 管 .1500 个 继电器 以 及 其 他 各 
种 元 器 件 , 在 机 器 表面 则 布 满 电 表 、 电 线 和 指示 灯 , 每 小 时 耗 电量 约 为 140kW。 这 样 
“巨大 ”的 计算 机 ,每 秒 可 以 进行 5000 次 加 法 运算 ,相当 于 手工 计算 的 20 万 信 。 计 算 一 条 炮 
弹 的 轨道 用 时 只 需 30s。ENIAC 原来 是 计划 为 第 二 次 世界 大 战 服务 的 ,但 它 投 入 运行 时 战 
争 已 经 结束 ,这 样 一 来 , 它 便 转 回 为 研制 氢弹 而 进行 计算 。 将 ENIAC 用 于 有 别 于 最 初 建造 
它 的 目的 ,表明 了 它 的 通用 性 。ENIAC 在 BRL 的 管理 下 继续 工作 ,直到 1955 年 被 拆除 。 

ee 加 DR : 


或 静电 存储 管 , 存 储 容量 很 小 ， pod 了 磁 鼓 磁 必 , 皇 有 一 定 改进 ， 但 存储 空间 仍然 有 限 ， 

(3) 输入 输出 设备 简单 ， 主要 采用 穿孔 纸 带 或 卡片 ,3 速度 很 慢 。 

) 程序 设计 语言 为 机 器 语言 ,几乎 没有 系统 软件 。 

在 这 一 时 期 ,人 们 主要 为 军事 和 国防 尖端 技术 的 需要 人 研制 计算 机 ,并 进行 有 头 
作 ,为 计算 机 的 发 展商 定 了 一 定 的 基础 ,其 研究 成 果 进 一 步 扩 展 到 民用 ,又 转 为 工业 产品 , 开 
始 逐 步 形 成 计算 机 工业 。 

典型 的 第 一 代 计 算 机 有 ENIAC、EDVAC、UNIVAC-T IBM 701、IBM 702、IBM 704、 
IBM 705 IJBM 650 等 。 


事实 上 ,第 一 代 电 子 管 技 术 的 计算 机 并 不 是 非常 可 靠 ,原因 是 这 些 电子 管 被 烧 坏 的 速度 
太 快 ,以 至 于 这 种 电子 管 计 算 机 的 停机 维修 时 间 常 常 比 正常 运行 的 时 间 还 多 。 


串 1 章 ”计算 机 系统 概 : 


1948 年 ,贝尔 实验 室 的 三 位 人 赋 究 员 John Bardeen、Walter Brattain 和 William Shockley 
发 明了 了 品 体 管 , 这 项 影响 座 远 的 发 明 , 让 他 们 共同 获得 了 1956 年 度 语 贝 尔 物 理学 奖 。 这 种 
新 型 的 技术 不 但 掀起 了 电子 甫 件 . 电 视 和 无 线 电 广 播 等 领域 的 车 谷 ,也 推动 计算 机 的 发 展 进 
入 了 一 个 新 的 时 代 。 

第 二 代 电 子 计算 机 的 主要 特点 是 : 

(1) 采用 晶体 管 代替 电子 管 作为 基本 元 器 件 。 与 电子 管 相 比 ,晶体管 具有 体积 小 .重量 
经 ,. 检 电 少 如 度 快 ,寿命 长 竺 优点 ,这 使 计算 机 的 设计 结构 和 性 能 都 产生 了 飞 了 

(2) 采用 三 芯 存储 器 作 为 主 存 ,使 用 磁盘 和 磁带 作为 畏 存 。 使 


训 程 语言 万 以 及 批 处 理 系 统 。 
在 这 一 时 期 ,计算 机 应 用 领域 进一步 扩大 , 除 科学 计算 外 ,还 用 于 数据 处 理 和 实时 控件 
等 领域 。 同 时 ,这 一 时 期 的 计算 机 产品 开始 重视 继承 性 , 形 立 用 范围 的 i 
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晶体 管 的 米 用 ,使 得 计算 机 的 体积 得 以 大 大 缁 小 ,可 徘 性 大 大 提高 。 然 而 随 看 计算 机 功 
能 的 不 断 增 强 ,所 使 用 的 品 体 管 数 量 也 随 之 增加 ,这 在 一 定 程度 上 又 影响 了 计算 机 的 性 能 及 
可 徘 性 ,从 而 限制 了 计算 机 的 发 展 。 在 20 世纪 40 年 代 电 子 管 所 碰 到 的 应 用 的 寡 境 ,又 戏剧 
性 地 呈现 在 品 体 管 面前 。 新 的 现实 促使 科学 家 寻找 新 的 解决 办 法 ,这 就 导致 第 三 代 电 子 华 
件 一 一 集成 电路 的 出 现 。 

1952 年 ,殉国 星 家 雷达 人 研究 所 的 G. W. A. Dummer 首先 提出 了 集成 电路 设想 : 根据 电 
于 线路 的 要 求 , 将 电子 线路 所 需要 的 铝 体 管 、 品 体 二 极 管 和 其 他 必要 元 件 统统 完整 地 制作 
(集成 ) 在 单 块 半导体 品 片 上 ,从 而 构成 一 个 具有 预定 功能 的 电子 线路 。 但 是 由 于 当时 缺乏 
先进 的 工业 手段 ,Dummer 的 设想 无 法 实现 。 

1958 年 ,美国 的 Jack Kilby 和 Robert S. Noyce 同时 发 明了 集成 电路 ( 昂 图 1-7) ,并 分 
别 在 得 克 院 斯 仪 硕 公司 和 仙 童 公司 研制 成 功 第 一 块 集 成 电路 ,从 而 开创 了 第 三 代用 至 以 后 
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计算 机 发 展 的 新 纪元 。 早 期 的 集成 电路 虽然 只 能 在 单 块 硅 片 上 集成 十 几 到 几 十 个 晶体 管 ， 
但 是 ,这 些 集 成 电路 的 尺寸 已 经 比分 立 元 件 的 晶体 管 还 要 小 。 使 用 和 集成 电路 的 计算 机 速度 
更 快 ,体积 更 小 且 价 格 也 更 加 便宜 。 

第 三 代 电 子 计算 机 的 主要 特点 是 : 

(1) 采用 集成 电路 取代 唱 体 管 作为 基本 元 上 套件 。 

(2) 采用 半导体 存储 大 作为 计算 机 的 主 存储 套 ,存储 容量 进一步 扩大 ,而 体积 更 小 ,可 
徘 性 更 高 。 

(3) 操作 系统 功能 进一步 明确 和 完善 ,高 级 语言 进一步 发 展 , 使 计算 机 功能 更 强 。 

(4) 计算 机 的 研制 生产 开始 系列 化 .通用 化 和 标准 化 。 计 算 机 应 用 范围 扩大 到 企业 管 
理 和 辅助 设计 等 领域 。 

OD 系列 化 : 即 同一 公司 在 不 同时 期 生产 的 计算 机 采用 相同 的 系统 结构 ,在 指令 系统 、 
数据 格式 、 字 和 从 编 色 控制 方式 、 输 入 输出 等 方面 保持 统一 ,从 而 保证 了 程序 非 容 ( 称 为 同 前 
莱 容 )。 这 种 癌 前 兼容 在 很 大 程度 上 可 以 保护 用 户 的 投资 尤其 是 在 软件 方面 的 投资 , 当 用 户 
进行 计算 机 更 新 时 ,原来 在 低档 计算 机 上 编写 的 程序 可 以 不 做 修改 就 使 用 在 高 档 计 算 机 上 。 
这 一 时 期 典型 的 系列 计算 机 如 IBM 360/370。 

@) 通用 化 : 机 器 指令 系统 丰富 ,兼顾 科学 计算 、 
各 种 应 用 的 需要 。 

标准 化 : 采用 标准 的 输入 输出 接口 ,因而 各 个 机 型 的 外 部 设备 都 是 通用 的 , 除 各 个 
型 号 计算 机 的 CPU 独立 设计 以 外 ,存储 天 、 外 部 设备 等 都 采用 标准 部 件 组 闭 。 

典型 的 第 三 代 计 算 机 有 IBM 360、PDP-T NOVA1200 等 。 


数据 处 理 、 实 时 控制 每 方面 ,可 以 适应 


5. 第 四 代 : 大 规模 和 超大 规模 集成 电路 计算 机 


随 春 必 片 技术 和 半导体 制造 工艺 的 不 断 发展 , 半 导体 必 斤 的 集成 度 越 来 越 高 。 所 谓 集 
成 度 是 指 单个 怪 片 上 所 容纳 的 晶体 管 数量 。 集 成 电路 技术 的 发 展 可 以 分 为 如 表 1-2 所 示 的 
几 个 阶段 ,其 中 ,大 规模 集成 电路 标志 看 第 四 代 计 算 机 的 开始 。 


表 1-2 集成 电路 发 展 阶段 


集成 电路 发 展 阶段 单 块 芯片 集成 的 晶体 管 数 量 
小 规模 集成 电路 (SST) 10~100 
中 规模 集成 电路 (MST) 100 一 1000 
大 规模 集成 电路 (LSD) 1000 一 10 000 
超大 规模 集成 电路 (VLSD) 10 万 以 上 
巨大 规模 集成 电路 (ULSD) 1000 万 以 上 


集成 度 的 提高 大 大 促进 了 计算 机 的 发 展 ,尤其 是 进入 20 世纪 70 年 代 , 大 规模 和 超大 规 
模 集 成 电路 的 发 展 使 计算 机 进入 一 个 飞速 发 展 的 年 代 。1997 年 ,为 纪念 第 一 台电 子 计算 机 
下 生 50 周年 ,一 群 宾夕法尼亚 大 学 的 学 生 制 造 了 一 个 单 蕊 片 的 ENIAC。 原 来 那个 占 地 
150m  、 童 30t 的 庞然大物 人 饿 做 风 到 只 有 手 指 指甲 大 小 的 一 块 心 厂 上 ， 

大 规模 和 超大 规模 集成 电路 技术 的 发 展 使 得 计算 机 系统 设计 者 有 了 很 大 的 施展 空间 ， 
也 使 得 第 四 代 计 算 机 从 各 方面 性 能 上 讲 都 有 了 很 大 提高 ,主要 体现 在 以 下 几 个 方面 : 
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(1) 在 计算 机 体系 结构 上 ,发 展 了 如 虚拟 存储 天 技术 流水线 技术 .高 速 缓冲 存储 疹 拉 
术 及 各 种 并 行 处 理 技 术 等 。 
(2) 在 计算 机 内 存 配置 上 ,容量 和 速度 都 大 幅度 提高 。 
(3) 计算 机 外 围 设 备 的 种 类 越 来 越 丰 是 ,从 文字 的 处 理发 展 到 图 像 、 声 首 等 
2 局 
(4) 系统 软件 功能 越 来 越 吕 ,从 单 用 户 . 单 逢 程序 系统 发 展 到 多 有 用户、 多 道 程 序 系 统 , 从 
字符 界面 的 命令 行 操作 系统 发 展 到 图 形 界面 的 Windows 操作 系统 。 

(5) 应 用 软件 越 来 越 丰 蝇 ,计算 机 在 办 公 月 动 化 .数据 处 理 .图 像 处 理 .语音 识别 和 人 工 
智能 等 领域 大 显 员 于。 尤其 是 随 痢 微型 计算 机 技术 的 发 展 ,计算 机 价格 越 来 越 便宜 ,计算 机 
从 机 房 走 同 干 家 万 户 。 

(6) 20 世纪 80 年 代 计 算 机 网 络 的 发 展 和 20 世纪 90 年 代 Internet 技术 的 发 展 ,一 方面 
使 计算 机 的 应 用 越 来 越 普 及 , 男 一 方面 在 很 大 程度 上 改变 着 人 们 的 生活 和 工作 方式 。 

值得 一 提 的 是 20 世纪 70 年 代 发 展 起 来 的 微型 i 多 术 。1971 年 ,Intel 公司 利用 
VLSI 技术 制造 出 世界 上 第 一 个 微 处 理 需 芯片 Intel 4004 ,第 一 次 将 一 个 4 位 CPU 的 全 音 
电路 和 功能 集成 到 一 块 半 导体 忆 片 上 。 第 二 年 ,Intel 公司 又 制造 出 8 位 的 微 处 理 般 Intel 
8008 ,其 后 又 推出 了 8080、8085。1978 年 和 1979 年 ,Intel 公司 又 分 别 推出 了 16 位 的 微 处 
理 器 Intel 8086 和 8088。 到 了 1981 年 ,IBM 公司 使 用 Intel 公司 的 8088 微 处 理 器 作为 
CPU ,微软 的 MS-DOS 作为 操作 系统 ,生产 出 一 台 有 具有 里 程 碑 意义 的 微型 计算 机 IBM PC， 
从 而 开创 了 微型 计算 机 发 展 的 新 纪元 。 其 后 , 随 着 微 处 理 磊 80286、80386、80486 和 
Pentium 等 的 不 断 推 出 ,一 代 又 一 代 新 型 微型 计算 机 也 不 断 推 回 市 场 , 直 到 今天 的 基于 
PIV 、 酯 窒 币 处理 角 的 计算 机 。 这 一 切 都 得 益 于 集成 电路 技术 的 发 展 ! 表 1-3 给 出 的 是 不 
同时 期 微 处 理 右 已 片 的 性 能 参数 。 

表 1-3 不 同时 期 微 处 理 器 芯片 的 性 能 参数 

型 号 Intel 4004 Intel 8008 Intel 8086 Pentium PIV Corei7 /i5/i3 
发 布 时 间 1971 年 1972 年 1978 年 1993 年 2000 年 2008 年 
时 钟 频率 108kHz 108kHz 5MHz 166MHz 1. 8GHz 3. 3GHz 
总 线 宽度 4 位 位 16 位 32 位 64 位 64 位 
晶体 管 数 2300 3500 29 000 3. 1 百 万 42 百 万 700 百 万 
工艺 /um 10 10 3 0.8 0. 18 32nm 
可 寻 址 存储 项 | 640B 16KB 1MB 4GB 64GB 64GB 
虚拟 存储 兹 和 Ee 64TB 64TB 64TB 
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6. 第 五 代 计 算 机 


对 于 前 四 代 计 算 机 ,计算 机 界 普遍 采用 的 是 按 计算 机 所 使 用 的 基本 元 器 件 进行 划分 。 
即 电子 管 计算 机 ,晶体 管 计算 机 ,中 小 规模 集成 电路 计算 机 和 大 规模 超大 规模 集成 电路 计算 
机 。 对 于 人 类 是 否 已 进入 第 五 代 计算 机 的 发 展 年 代 ,或 到 底 什么 样 的 技术 标志 着 第 五 代 计 
算 机 的 开始 , 尚 无 统一 的 定论 ， 

在 计算 机 领域 ,作为 第 一 台电 子 计算 机 的 诞生 国美 国 ,其 计算 机 技术 一 直 处 于 世界 领先 
水 平 。 日 本 虽然 是 工业 发 达 国家 ,但 从 计算 机 整体 发 展 水 平 看 ,一 直 以 来 落后 于 美国 。 然 而 
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日 本 并 不 甘 洲 后 ,1981 年 10 月 ,日 本 首先 加 世界 宣告 开始 研制 第 五 代 计 算 机 ,并 于 1982 年 
4 月 制订 了 为 期 10 年 的 “第 五 代 计 算 机 技术 开发 计划 ”。 紧 接 其 后 美国 和 欧洲 等 国家 也 先 
是 出 了 发 展 第 五 代 计 算 机 的 计划 。 

第 五 代 计 算 机 又 称 新 一 代 计 算 机 或 人 工 智 能 计算 机 , 它 是 一 个 能 把 信息 采集 、 存 储 、 人 处 
理 .通信 同人 工 智 能 结合 在 一 起 的 智能 计算 机 系统 。 它 除了 能 进行 数值 计算 及 信息 处 理 外 ， 
还 能 面 回 知识 处 理 , 具 有 形式 化 推理 .联想 .学 习 和 解释 的 能 力 ; 能 够 帮助 人 们 进行 判断 , 决 
策 .开拓 未 知 领 域 和 获得 新 的 知识 ; 人 和 计算 机 之 间 可 以 直接 通过 自然 语言 (声音 、 文 字 ) 或 
图 形 图 像 交 换 信 生 。 

第 五 代 计 算 机 是 为 适应 未 来 社会 信息 化 的 要 求 而 提出 的 ,与 前 四 代 计 算 机 有 着 本 质 的 
区 别 ,是 计算 机 发 展 史 上 的 一 次 重要 弯曲。 当前 电子 计算 机 存在 的 主要 不 足 有 : 首先 ,目前 
的 电子 计算 机 虽然 已 具有 一 些 相 当 幼 稚 的 “智能 ”, 但 它 不 能 进行 联想 ( 即 根据 某 一 信息 ,从 
记忆 中 取出 其 他 有 关 信 息 的 功能 ) ,推论 (针对 所 给 的 信息 ,利用 已 记忆 的 信息 对 未 知 问题 进 
行 推 理 得 出 结论 的 功能 ) ,学习 (将 对 应 新 间 题 的 内 容 , 以 能 够 高 度 灵活 地 加 以 运用 的 方式 进 
行 记忆 的 功能 ) 等 人 类 头脑 最 普通 的 思维 活动 ; 其 次 ,目前 电子 计算 机 虽然 已 能 在 一 定 程度 
上 上 配合、 辅助 人 类 的 脑力 入 动 ,但 是 ,和 它 还 不 能 天正 听 和 届 人 的 语 首 , 读 异 人 的 文 草 ,还 和 宕 要 由 
专家 用 电子 计算 机 慌 得 的 特殊 的 “程序 语言 ” 同 它 进行 “对 话 ”。 这 就 大 大 限制 了 电子 计算 机 
的 应 用 和 普及 ; 再 次 ,目前 的 电子 计算 机 虽然 能 以 惊 人 的 信息 人 处理 来 完成 人 类 无 法 完成 的 
工作 (如 遥控 已 发 射 的 火箭 ) ,但 是 它 仍 不 能 满足 某 些 科技 领域 的 高 速 大量 的 计算 任务 的 要 
求 。 例 如 ,在 进行 超 高 层 建筑 的 而 震 设计 时 ,为 解析 一 种 立柱 模型 党 到 摇动 时 的 三 维 振动 情 
况 , 用 目前 的 超大 型 电子 计算 机 算 上 100 年 也 难以 完成 。 又 如 ,原子 反应 堆 事 故 和 核 聚 变 反 
应 的 模拟 实验 、 资 源 探测 卫星 发 回 的 图 像 数 据 的 实时 解析 、 飞 行 闫 的 风 洞 实验 、 天 气 了 预报、 地 
震 预 测 等 要 求 极 高 的 计算 速度 和 精度 ,都 远 远 超出 目前 电子 计算 机 的 能 力 极 限 。 由 此 可 见 ， 
当今 的 电子 计算 机 已 不 能 适应 信息 社会 的 需要 ,必须 在 加 新 的 理论 和 技术 基础 上 创造 新 一 
代 计 算 机 ，。 

当然 ,让 计算 机 具有 像 我 们 人 类 一 样 能 够 进行 学 习 、 思 维 \ 推 理 等 能 力 的 大 脑 是 一 种 理 
想 , 要 实现 这 一 理想 还 有 很 长 的 路 要 走 。 但 不 管 怎 样 , 计 算 机 技术 日 新 月 异 、 层 出 不 穷 是 不 
争 的 事实 。 以 下 列举 一 些 近 些 年 在 计算 机 领域 出 现 的 新 的 技术 : 

(1) 生物 计算 机 。 生 物 计 算 机 使 用 生物 忆 片 ,生物 芯片 是 用 生物 工程 技术 产生 的 重 日 
质 分 子 制 成 。 生 物 必 片 存 储 能 力 巨 大 ,运算 速度 比 当 前 的 巨型 计算 机 还 要 快 10 万 倍 , 能 
量 消耗 则 为 其 10 亿 分 之 一 。 由 于 有恒 白质 分 子 具 有 上 自 组 织 . 肯 调节、 月 修复 和 再 生 能 力 ， 
使 得 生物 计算 机 具有 生物 体 的 一 些 特 点 ,如 自动 修复 必 片 发 生 的 故障 ,还 能 模仿 人 脑 的 
思考 机 制 。 

(2) 光子 计算 机 。 光 子 计算 机 利用 光子 取代 电子 进行 数据 运算 、 传 输 和 存储 。 在 光子 
计算 机 中 ,不 同 波长 的 光 表 示 不 同 的 数据 ,可 快速 完成 复杂 的 计算 工作 。 

与 电子 计算 机 相 比 ,光子 计算 机 具有 以 下 优点 : 超 高 速 的 运算 速度 .强大 的 并 行 处 理 能 
力 、 大 存储 量 、 非 常 强 的 抗 十 扰 能 力 等 。 据 推测 ,未 来 光子 计算 机 的 运算 速度 可 能 比 今天 的 
馈 级 计算 机 快 1000 倍 以 上 。 

(3) 超 导 计 算 机 。 由 超 导 元 件 和 电路 组 成 的 计算 机 ,可 依据 超 导 元 件 的 特殊 性 能 而 突 
破 电 子 计算 机 的 局 限 , 使 速度 更 快 ,消耗 更 小 。 
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这 里 再 介绍 一 下 我 国 计 算 机 技术 的 发 展 概 况 。 我 国 从 1956 年 开始 研制 计算 机 ,1958 
年 研制 成 功 第 一 台电 子 管 计 算 机 103 机 ,1959 年 又 研制 成 功 运行 速度 为 每 秒 1 万 次 的 104 
机 。103 机 和 104 机 的 研制 成 功 填补 了 我 国 在 计算 机 技术 领域 的 空 日 ,为 促进 我 国 计 算 机 
技术 的 发 展 做 出 了 页 献 。1965 年 ,中科院 计算 所 研制 成 功利 一 侣 大 型 品 体 管 计算 机 109 乙 
机 ,之 后 推出 109 两 机 ,该 机 在 我 国 两 弹 试验 中 发 挥 了 重要 作用 。 

1971 年 我 国 开始 研制 以 集成 电路 为 主要 表 件 的 DJS 系列 计算 机 ,1974 年 ,清华 大 学 等 
单位 联合 设计 、 研 制 成 功 采 用 集成 电路 技术 的 DJS-130 小 型 计算 机 ,运算 速度 达 每 秒 100 万 
次 。 该 系列 计算 机 在 20 世纪 70 年 代 在 我 国 很 多 行业 和 部 门 得 到 了 广泛 应 用 。 

在 微型 计算 机 方面 ,1985 年 ,电子 工业 部 计算 所 研制 成 功 与 IBM PC 兼容 的 长 城 
0520CH 微型 计算 机 。 此 后 我 国 的 长 城 系 列 . 方 正 系列 .联想 系列 等 微型 计算 机 ,如 雨 后 春 
宥 般 浦 现 ,为 我 国 计 算 机 的 普及 应 用 做 出 了 贡献 ,也 使 目前 以 联想 公司 为 代表 的 中 国 计 算 机 
公司 成 为 了 一 个 有 着 巨大 影 啊 力 的 跨国 公司 , 走 在 了 世界 先进 计算 机 技术 的 行列 。 

在 巨型 计算 机 研制 方面 ,1983 年 ,国防 科技 大 学 人 研制 成 功 运 算 速 度 每 秒 亿 次 的 银河 - 
巨型 机 ,这 是 我 国 高 性 能 计算 机 人 研制 领域 的 一 个 重要 里 程 碑 。1992 年 ,国防 科技 大 学 又 推 
出 了 银河 -开通 用 并 行 巨型 机 ,峰值 速度 达 每 秒 10 亿 次 。 银 河 - 开 为 共享 主 存储 占 的 四 处 理 
人 艇 回 量 机 ,其 回 量 中 央 处 理 天 是 采用 中 小 规模 集成 电路 目 行 设计 的 ,总 体 上 达到 了 20 世纪 
80 年 代 中 后 期 国际 先进 水 平 , 它 主要 用 于 中 期 天 气 预 报 、 石 油 勘 探 和 核 工 业 领域 等 。1997 
年 6 月 ,国防 科技 大 学 研制 成 功 银河 - 轩 百 亿 次 并 行 巨 型 计算 机 系统 ,采用 可 扩展 分 布 共 至 
存储 并 行 处 理 体系 结构 ,由 130 多 个 处 理 太 点 组 成 ,峰值 性 能 为 每 秒 130 亿 次 浮 点 运算 , 系 
统 综 合 技 术 达 到 了 20 世纪 90 年 代 中 期 国际 先进 水 平 。 

1995 年 ,曙光 公司 推出 了 国内 第 一 人 台 具 有 大 规模 并 行 处 理 船 (MPP) 结 构 的 并 行 机 曙光 
1000( 舍 36 个 处 理 机 ) ,峰值 速度 每 秒 25 亿 次 浮 点 运算 ,实际 运算 速度 上 了 每 秒 10 亿 次 浮 
点 运算 这 一 高 性 能 台阶 。 昌 光 1000 与 美国 Intel 公司 1990 年 推出 的 大 规模 并 行 机 体系 结 
构 与 实现 技术 相近 ,这 是 我 国 独立 人 赋 制 的 第 一 套 大 规模 并 行 机 系统 ,打破 了 外 国 在 大 规模 并 
行 机 技术 方面 的 封锁 和 垄断 ,使 我 国 在 这 一 领域 的 水 平 与 国外 的 差距 缩小 到 5 年 左右 。 
1997 至 1999 年 ,明光 公司 先后 在 市 场 上 推出 具有 机 群 结构 (Cluster) 的 明光 1000A 、 盟 光 
2000- 工 和 曙光 2000- 下 等 超级 服务 郑 , 峰 值 计算 速 度 已 突破 每 秒 1000 亿 次 浮 点 运算 ,机 璐 
规模 已 超过 160 个 处 理 副 。1999 年 ,国家 并 行 计 算 机 工程 技术 研究 中 心 研制 的 神威 工 计算 
机 通过 了 国家 级 验收 ,并 在 国家 气象 中 心 投 入 运行 ,系统 有 384 个 运算 处 理 单元 ,峰值 运算 
速度 达 每 秒 3840 亿 次 。2000 年 ,曙光 公司 推出 每 秒 3000 亿 次 浮 点 运算 的 曙光 3000 超级 
服务 器 。2003 年 ,日 万 亿 次 数据 处 理 超级 服务 表明 光 4000L 通过 国家 验收 , 青 一 次 刷新 国 
产 超级 服务 天 的 历史 纪录 ,使 得 国产 高 性 能 机 产业 再 上 一 个 新 台阶 。 

2004 年 ,中国 研 制 的 超级 计算 机 曙光 4000A 第 一 次 正式 进入 国际 超级 计算 机 排行 榜 第 
10 名 。2008 年 ,曙光 5000A 的 浮 点 运算 峰值 处 理 能 力 达 到 每 秒 230 万 亿 次 ,实测 Linpack 
速度 达到 每 秒 180. 6 万 亿 次 ,再 次 跻身 世界 超级 计算 机 的 前 10 名 。2009 年 10 月 国防 科技 
大 学 研制 成 功 天 河 一 号 超级 计算 机 ,由 103 台 机 柜 组 成 ,包含 6144 颗 英 特 尔 CPU 和 5120 
颗 GPU, 系 统 峰 值 性 能 为 每 秒 1206 万 亿 次 ,Linpack 测试 性 能 每 秒 560 万 亿 次 ,在 世界 
TOP500 中 排名 第 五 。2010 年 5 月 曙光 公司 和 中 科 院 计算 所 合作 研制 成 功 曙 光 星 云 超级 
计算 机 ,系统 峰值 性 能 约 为 每 秒 3000 万 亿 次 ,Linpack 测试 性 能 每 秒 1271 万 亿 次 ,在 世界 
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TOP500 中 排名 第 二 。2013 年 5 月 ,由 国防 科大 研制 的 天 河 二 号 超级 计算 机 系统 ,以 峰值 
计算 速度 每 秒 5. 49 亿 亿 次 .持续 计算 速度 每 秒 3. 39 亿 亿 次 双 精 度 浮 点 运算 的 优异 性 能 位 
居 榜 首 , 成 为 全 球 最 快 超级 计算 机 。 值 得 一 提 的 是 ,在 2014 年 6 月 23 日 公布 的 全 球 超级 计 
算 机 TOP500 榜 单 中 ,中 国 “ 天 河 二 号 ?以 比 第 二 名 美国 “泰坦 ? 快 近 一 倍 的 速度 连续 第 三 次 


知识 拓展 


摩尔 定律 

摩尔 定律 是 前 英特尔 联合 创始 人 蕊 登 。 摩 尔 (Gordon Moore) 首 先 提 出 的 ,其 内 容 是 
:集成 电路 (IC) 芯 片 中 所 能 集成 的 晶体 管 数量 每 18 个 月 翻 一 盔 , 性 能 也 随 之 提升 一 倍 。 

1965 年 ,摩尔 在 为 撰写 一 篇 有 关 集 成 电路 的 文章 而 整理 材料 和 绘制 数据 时 ,发 现 了 一 
个 惊人 的 趋 执 : 集成 电路 芯片 的 集成 度 呈 现 很 有 规律 的 几何 增长 ,每 新 一 代 忌 片 的 容量 大 
体 为 前 一 代 的 两 售 , 而 新 一 代 芯 片 的 产生 大 约 为 一 年 的 时 间 。 于 是 摩尔 总 结 得 出 结论 : 集 
成 电路 芯片 中 所 能 容纳 的 晶体 管 数量 每 年 增加 一 倍 。 厚 尔 的 这 一 发 现 发 表 在 当年 第 35 期 
《电子 杂志 上 ,这 是 他 一 生 中 最 为 重要 的 文章 ,这 篇 不 经 意 之 作 也 是 迄今 为 止 半 吕 体 发 展 史 


并 在 文章 中 描绘 了 下 pe 的 容量 会 未 年 递增 。 从 60 个 元 件 扩展 
到 64 000 We 而 价格 上 则 是 相应 地 逐年 递减 ,当时 有 买 一 个 元 件 的 价格 10 年 后 可 
买 一 个 集成 芯片 ,这 是 一 个 长 期 推断 。 它 的 事实 曲线 比 我 想象 得 更 好 ”, 

摩尔 总 结 的 这 一 规律 ,由 于 其 可 预见 性 和 重要 性 被 正式 定义 为 摩尔 定律 。1975 年 , 麻 
尔 对 这 一 结论 做 了 一 些 修正 ,将 翻番 的 时 间 从 一 年 调整 为 两 年 。 实 际 上 ,后 米 更 准确 的 时 间 
是 18 个 月 。 

“摩尔 定律 ?不 是 一 条 简明 的 自然 科学 定律 ,而 是 一 条 融 自 然 科 学 .高 技术 、 经 济 学 、 社 会 
学 等 学 科 为 一 体 的 多 学 科 、 开 放 性 的 规律 。 尤 其 是 “摩尔 定律 ?的 经 济 学 效益 ,使 其 成 了 英 特 
尔 公 司 的 发 展 指针 。 

pi 

“我 没有 去 估算 具体 的 速率 ,但 可 
小 月 ” 

2006 年 1 月 英特尔 45nm 生产 工艺 的 蕊 片 ,该 芯片 只 有 指甲 大 
小 ,但 上 面 却 有 10 亿 个 晶体 管 , 且 这 些 唱 体 管 只 有 45nm 见方 , 比 红 血球 还 要 小 1000 倍 左 
右 。 这 为 今后 推出 更 商 性 能 、 更 高 效率 的 处 理 器 打下 了 基础 。 

2007 年 初 ,IBM 宣布 在 制造 环境 中 实现 了 一 种 突破 性 的 芯片 堆 合 技术 ,将 传统 上 并 排 
安装 在 硅 片 上 的 芯片 和 内 存 设 备 以 堆 胎 的 方式 相互 登 加 在 一 起 ,最 终 实现 了 一 种 紧凑 的 组 
件 层 状 结构 ,大 大 减 小 了 芯片 的 体积 ,并 提高 了 数据 在 芯片 上 各 个 功能 区 之 间 的 传输 速度 。 
这 种 被 称 为 "“ 穿 透 硅 通道 (through-silicon Vias)” 的 技术 可 以 大 大 缩小 不 同 芯 片 组 件 之 间 的 
距离 ,从 而 设计 出 速度 更 快 、 体 积 更 小 和 能 耗 更 低 的 系统 。 此 举 也 许 会 令 厚 尔 定律 不 仅 延 
续 , 而 且 可 能 突破 原来 预期 的 极限 。 


。 厚 尔 本 人 认为 它 还 会 延续 今后 几 代 产品 。 
。 翻 一 理 的 时 间 将 会 是 三 年 而 不 是 18 
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1.2 计算 机 的 种 类 


计算 机 按照 其 用 途 分 为 通用 计算 机 和 专用 计算 机 。 专 用 计算 机 主要 是 为 某 一 专用 领域 
设计 的 ,在 这 一 领域 具有 高 性 能 或 适应 性 ,如 一 些 专 为 图 像 处 理 设 计 的 计算 机 ,具有 很 高 的 
图 像 处 理 速 上 度 ; 再 如 工控 机 , 专 为 一 些 环境 较为 恶劣 的 工业 控制 领域 而 设计 ,具有 防 人 尘 \ 防 
振 .高 可 徘 性 等 特点 。 通 用 计算 机 则 不 是 专 为 某 一 领域 而 设计 的 , 它 能 适应 各 种 应 用 的 
要 求 。 

对 计算 机 种 类 的 划分 ,更 为 传统 和 更 为 普遍 的 方法 是 按照 1989 年 由 IEEE 科学 巨型 机 
委员 会 提出 的 运算 速度 分 类 法 ,将 计算 机 分 为 巨型 机 、 大 型 机 、 小 型 机 ,工作 站 和 微型 计 
算 机 。 


1. 巨型 机 


巨型 机 有 极 高 的 速度 . 极 大 的 容量 。 主 要 应 用 于 国防 尖 闯 技术 .空间 技术 .大 范围 长 期 
性 天 气 预 报 、 石 油 勘 探 等 领域 。 目 前 巨型 机 的 运算 速度 已 超过 每 秒 万 亿 次 。 这 类 计算 机 在 
技术 上 了 袁 两 个 方 同 发 展 ; 一 是 开发 局 性 能 元 币 件 ,特别 是 缩短 时 钟 周 期 ,提高 单机 性 能 ; 二 
是 采用 多 处 理 硕 结构 ,构成 超级 并 行 计 算 机 , 通 筑 由 100 台 以 上 的 处 理 右 组 成 超级 并 行 巨 型 
计算 机 系统 ,它们 同时 解 算 一 个 题目 ,来 达到 高 速 运算 的 目的 。 

巨型 机 的 人 研制 水 平 . 生 产能 力 及 其 应 用 程度 ,已 成 为 衡量 一 个 国家 经 济 实力 与 科技 术 平 
的 重要 标志 。 


2. 大 型 机 


这 类 计算 机 具有 很 强 的 综合 处 理 能 力 ,性 能 高 ,管理 能 力 强 。 作 为 通用 计算 机 ,主要 应 
用 在 政府 .银行 、 大 企业 等 部 门 或 行业 ,作为 中 心 数 据 库 服 务 屁 或 应 用 服务 占 等 ,可 同时 支持 
几 十 个 大 型 数据 库 和 上 万 个 用 户 使 用 。 


3. 小 型 机 


小 型 机 相对 大 型 机 来 说 ,规模 更 小 性 能 也 次 之 。 但 由 于 其 可 靠 性 高 .易于 维护 等 特点 ， 
得 到 了 广泛 应 用 。 在 20 世纪 七 八 十 年 代 , 小 型 机 的 发 展 非常 迅猛 ,很 多 行业 和 部 门 都 使 用 
了 小 型 机 ,国际 上 一 些 大 的 计算 机 公司 ,如 IBM、HP、DEC 等 纷纷 推出 了 自己 的 小 型 机 系 
列 。 从 20 世纪 90 年 代 开 始 , 随 着 微型 计算 机 的 性 能 不 断 提高 和 成 本 不 断 降 低 ,小 型 机 市 场 
受到 了 很 大 的 冲击 ,一些 原来 使 用 小 型 机 的 场合 被 高 性 能 微机 服务 器 所 取代 ， 

目前 ,小 型 机 主要 采用 的 是 基于 RISC 技术 的 CPU 和 类 UNIX 操作 系统 。 


4. 微型 机 


1971 年 ,美国 Intel 公司 生产 出 了 世界 上 第 一 块 微 处 理 带 也 片 Intel 4004,1981 年 美国 
IBM 公司 使 用 Intel 8088 微 处 理 器 生产 了 具有 里 程 碑 意义 的 微型 计算 机 IBM PC, 从 而 揭 开 
了 微型 机 大 发 展 的 序幕 。 微 型 机 技术 在 短 短 三 十 多 年 的 时 间 里 发 展 迅 猛 ,平均 每 两 年 世 
的 集成 度 可 提高 一 倍 , 从 而 使 得 性 能 提高 ,价格 降低 。 平 均 2 一 3 年 产品 就 更 新 换代 一 次 , 几 


12 


Ny 


计算 机 组 织 与 结构 


平 每 个 月 部 有 相关 周边 新 产品 出 现 。 
随 着 Internet 的 普及 ,微型 机 已 经 像 家 用 电 兹 一 样 走 同 了 和 干 家 万 户 。 


5. 工作 站 


工作 站 也 是 一 台独 立 的 计算 机 ,性 能 一 般 介 于 小 型 机 和 微型 机 之 间 。 它 往往 作为 独立 
的 计算 机 (或 联网 ) 应 用 于 一 些 具 有 特殊 要 求 的 领域 ,如 电影 动画 特技 制作 和 制造 业 机 械 
CAD 就 广 沁 使 用 了 图 形 工 作 站 。 

当然 ,计算 机 的 分 类 不 是 一 成 不 变 的 。 一 方面 ,性 能 的 划分 是 相对 的 ,例如 在 某 一 时 期 
按 性 能 划分 为 大 型 机 的 计算 机 可 能 在 硅 干 年 后 还 不 如 一 般 微 型 机 的 性 能 ; 男 一 方面 , 随 着 
计算 机 新 技术 的 不 断 出 现 , 新 类 型 的 计算 机 系统 也 不 断 被 推出 ,例如 近 些 年 被 广泛 应 用 的 骸 
入 式 计 算 机 系统 就 可 以 看 成 一 种 新 型 的 计算 机 系统 。 

但 是 , 随 看 拉 术 的 进步 ,各 种 型 号 的 计算 机 性 能 指标 都 在 不 断 地 改进 和 提 融 ,以 至 于 过 
去 一 台大 型 机 的 性 能 可 能 还 比 不 上 今天 一 人 台 微 型 计算 机 。 按 照 巨 大、 小 . 微 . 工作 站 的 标准 
来 划分 计算 机 的 类 型 也 有 其 时 间 的 局 限 性 ,因此 计算 机 的 类 别 划 分 很 难 有 一 个 精确 的 标准 。 
在 此 可 以 根据 计算 机 的 综合 性 能 指标 ,结合 计算 机 应 用 领域 的 分 布 将 其 分 为 以 下 5 大 类 。 


1. 高 性 能 计算 机 


局 性 能 计算 机 也 就 是 俗称 的 超级 计算 机 ,或 者 以 前 说 的 巨型 机 。 目 前 国际 上 对 高 性 能 
计算 机 的 最 为 权威 的 评测 是 世界 计算 机 排名 ( 即 Top 500), 通 过 测评 的 计算 机 是 目前 世界 
上 运算 速度 和 处 理 能 力 均 堪 称 一 流 的 计算 机 。2009 年 10 月 国防 科技 大 学 研制 成 功 天 河 一 
号 超级 计算 机 ,由 103 台 机 柜 组 成 ,包含 6144 颗 英 特 尔 CPU 和 5120 颗 GPU, 系 统 峰 值 性 
能 为 每 秒 1206 万 亿 次 ,Linpack 测试 性 能 每 秒 560 万 亿 次 ,在 世界 Top 500 中 排名 第 五 。 
2013 年 5 月 ,由 国防 科技 大 学 研制 的 天 河 二 号 超级 计算 机 系统 ,以 峰值 计算 速度 每 秒 5. 49 
亿 亿 次 .持续 计算 速度 每 秒 3. 39 亿 亿 次 双 精 度 浮 点 运算 的 优异 性 能 位 拓 榜 首 , 成 为 全 球 最 
快 的 超级 计算 机 。 


2. 微型 计算 机 


大 规模 集成 电路 及 超大 规模 集成 电路 的 发 展 是 微型 计算 机 得 以 产生 的 前 提 。 通 过 集成 
电路 技术 将 计算 机 的 核心 部 件 运算 入 和 控制 痊 集 成 在 一 块 大 规模 或 超大 规模 集成 电路 心 
上 ,统称 为 中 央 处 理 责 (CCentral Processing Unit,CPU)。 中 央 处 理 骨 是 微型 计算 机 的 核心 
部 件 ,是 微型 计算 机 的 心脏 。 目 前 微型 计算 机 已 广 沁 应 用 于 办 公 \、 学 习 、 娱 所 等 社会 生活 的 
方方面面 ,是 发 展 最 快 、 应 用 最 为 普及 的 计算 机 。 人 们 日 党 使 用 的 台式 计算 机 、 笔 记 本 计算 
机 、 和 区 上 型 计算 机 等 都 是 微型 计算 机 。 


3. 工作 站 


工作 站 是 一 种 高 梢 的 微型 计 自 机 , 通 和 配 有 高 分 辨认 的 大 屏 及 显 示 辫 及 容量 很 大 的 内 
存储 全 和 外 部 存 人 备货, 主要 面 同 专业 应 用 领域 ,具备 强大 的 数据 运算 与 图 形 、 图 像 处 理 能 力 。 
工作 站 主要 是 为 满足 工程 设计 动画 制作 、 科 学 全 究 、. 软 件 开发 .金融 管理 .信息 服务 .模拟 仿 
真 每 专业 领域 而 设计 开发 的 高 性 能 微型 计算 机 。 
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需要 指出 的 是 ,这 里 所 说 的 工作 站 不 同 于 计 自 机 网 络 系统 中 的 工作 站 概念 ,计算 机 网 络 
系统 中 的 工作 站 仅 是 网 络 中 任何 一 合 普通 微型 机 或 终端 ,只 是 网 络 中 的 任 一 用 户 和 点 。 


4. 服务 前 


服务 器 是 指 在 网 络 环境 下 为 网 上 多 个 用 户 提供 共享 信息 资源 和 各 种 服务 的 一 种 高 性 能 
计算 机 ,在 服务 器 上 需要 安装 网 络 操作 系统 、 网 络 协议 和 各 种 网 络 服务 软件 。 服 务 器 主要 为 
网 络 用 户 提供 文件 数据库、 应 用 及 通信 方面 的 服务 。 


5. 和 藤 入 式 计算 机 


嵌入 式 计算 机 是 指 谨 和 对 象 体系 中 ,实现 对 象 体系 智 能 化 控制 的 专用 计算 机 系统 。 襄 
入 式 计算 机 系统 是 以 应 用 为 中 心 ,以 计算 机 技术 为 基础 ,并 且 软 硬件 可 裁剪 ,适用 于 应 用 系 
统 , 对 功能 .可 靠 性 成本、 体积 . 功 耗 有 严格 要 求 的 专用 计算 机 系统 。 它 一 般 由 嵌入 式微 处 
理 器 、 外 围 硬 件 设备 .嵌入 式 操作 系统 以 及 用 户 的 应 用 程序 4 个 部 分 组 成 ,用 于 实现 对 其 他 
没 备 的 控制 .监视 或 管理 等 功能 。 例 如 ,人 们 上 日常 生活 中 使 用 的 电 冰 箱 、 全 自动 洗衣 机 、 空 
调 .电饭煲 数码 产品 等 都 采用 谍 入 式 计算 机 技术 。 


知识 拓展 


计算 机 系统 性 能 评测 

对 计算 机 系统 性 能 的 评测 可 以 帮助 用 户 进 行 计算 机 的 选 型 。 国 际 上 曾 出 现 过 很 多 种 评 
测 体系 ,其 中 ,应 用 面 较 广 泛 的 包括 TPC 评测 体系 和 SPEC 评测 体系 等 。 

1. TPC 评测 体系 

事务 处 理性 能 委员 会 (Transaction processing Performance Council,TPC) 是 由 数 十 家 
会 员 公 司 创 建 的 非 营利 组 织 ,总 部 设 在 美国 。TPC 的 成 员 主 要 是 计算 机 软 硬 件 厂 家 ,而 非 
计算 机 用 户 , 其 功能 是 制定 商务 应 用 基准 程序 的 标准 规范 .性 能 和 价格 量度 ,并 管理 测试 结 
果 的 发 布 。 

TPC 不 给 出 基准 程序 的 代码 ,而 只 给 出 基准 程序 的 标准 规 攻 。 任 何 厂 冢 或 其 他 测试 者 
都 可 以 根据 规范 ,最 优 地 构造 出 自己 的 测试 系统 (测试 平台 和 测试 程序 ) 。 为 保证 测试 结果 
的 完整 性 ,被 测试 者 (通常 是 厂家 ) 必 须 提 交 给 TPC 一 套 完 整 的 报告 ,包括 被 测 系 统 的 详细 
配置 分 类 价格 和 包含 5 年 维护 费用 在 内 的 总 价格 。 该 报告 必须 由 TPC 授权 的 审核 员 核 
实 。TPC 在 全 球 只 有 不 到 10 名 审核 员 , 全 部 在 美国 。 

2. SPEC 评测 体系 

SPEC 评测 体系 由 Standard Performance Evaluation Corp 制定 ,被 引用 也 广泛 的 指标 
主要 包括 针对 CPU 性 能 的 SPEC CPU 2000 和 针对 Web 服务 器 的 SPEC Web 2005 每 。 

SPEC CPU 2000 是 一 组 针对 CPU 和 内 存 的 测试 , 它 主要 测试 的 对 象 是 CPU 内存。 
SPEC CPU 2000 由 许多 源 代码 程 厅 组 成 ,分 成 “整数 ”和 “ 浮 点 数 ” 两 组 。SPECint 2000 就 是 


言 , 它 们 不 使 用 CPU 的 浮 点 单元 ; 而 “ 浮 点 数 ” 部 分 有 14 个 程序 ,使 用 FORTRAN 77/90 和 
C 语言 ,这 些 程序 的 主要 运算 是 浮 点 数 的 。 
SPECint 2000 和 SPECfp 2000 的 结果 ,以 执行 时 间 为 准 。 每 个 程序 的 执行 时 间 和 一 个 
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参考 平台 (Sun Ultra5/10 300MHz) 相 比 , 计 算出 其 倍数 。 如 果 执 行 时 间 和 参考 平台 相同 ， 
结果 就 是 100。 如 果 只 花 了 一 半 时 间 完 成 ,结果 就 是 200。“ 整 数 ”的 12 个 程序 的 结果 , 取 其 
平均 值 ,得 到 的 就 是 SPECint 2000 的 测试 结果 。“ 浮 点 数 ” 的 14 个 程序 也 是 一 样 。 

SPEC Web 2005 测试 的 原理 是 ,通过 多 台 客 户 机 向 服务 器 发 出 Http Get 请 求 ,请 求 调 
用 Web 服务 器 上 的 网 页 文件 ,这 些 文件 从 数 千 字 节 到 数 兆 字 节 不 等 。 在 相同 的 时 间 里 , 服 
务 器 回答 的 请 求 越 多 ,就 表明 服务 器 对 客户 端的 处 理 能 力 越 强 , 系 统 的 Web 性 能 就 越 好 。 


1.3 计算 机 的 性 能 指标 


计算 机 的 性 能 指标 是 指 能 在 一 定 程度 上 衡量 计算 机 优 劣 的 技术 指标 ,计算 机 的 优 劣 是 
由 多 项 技术 指标 综合 确定 的 ,而 这 些 指标 主要 包括 吞吐 量 、 响 应 时 间 、CPU 时 钟 周期 、 主 频 、 
CPI、CPU 执行 时 间 、MIPS、MFLOPS、、GFLOPS、TFLOPS、PFLOPS 等 。 


1. 吞吐 量 
在 一 个 评价 期 间 内 ,计算 机 系统 完成 的 所 有 工作 负载 称 为 行 吐 量 。 

2. 响应 时 间 

啊 应 时 间 指 用 户 输入 一 个 作业 (或 事务 ) 至 输出 开始 之 间 的 间 隅 时 间 。 
3. 主 频 /CPU 时 钟 周 其 


CPU 的 主 频 是 CPU 内 核 工作 的 时 钟 频率 ,一 般 以 MHz 或 GHz 为 单位 。 很 多 人 认为 


CPU 的 主 频 就 是 其 运行 速度 ,其 实 不 然 。CPU 的 主 频 表示 在 CPU 内 数字 脉冲 信号 振荡 的 


速度 ,与 CPU 实际 的 运算 能 力 并 没有 直接 关系 。 主 频 和 实际 的 运 鼻 速 度 仓 在 一 定 的 关系 
(在 同一 个 系列 计算 机 中 ,在 同样 条 件 下 , 主 频 越 高 ,速度 越 快 ) ,但 目前 还 没有 一 个 确定 的 公 


式 能 够 定量 两 者 的 数值 关系 ,因为 CPU 的 运算 速度 还 要 看 CPU 的 流水 线 各 方面 的 性 能 指 
标 ( 缓 存 .指令 集 .CPU 的 位 数 等 ) 。 


CPU 时 钟 周 期 是 一 个 时 间 的 量 ,一 般 以 微 


秒 或 纳 秒 为 单位 。 主 频 的 倒数 就 是 CPU 时 


钟 周 期 ,这 是 CPU 中 最 小 的 时 间 元 系 。 每 个 操作 至 少 需 要 一 个 时 钟 间 期 。 


4. CP| 


每 条 指令 执行 需要 的 时 钟 周 期 数 (Cycle Per Instruction,CPI) 指 CPU 的 指令 时 钟 数 。 


表示 每 条 计算 机 指令 执行 所 需 的 时 钟 周 期 数 。 由 于 不 同 指令 的 功能 不 同 , 造 成 指令 执行 时 
间 不 同 , 即 指令 执行 所 用 的 时 钟 数 不 同 , 所 以 CPI 应 该 是 一 个 平均 值 。 


5， CPU 执行 时 间 


CPU 执行 时 间 是 指 CPU 全 速 工 作 时 完成 东 进 程 所 花费 的 时 间 ,计算 公式 如 下 : 


Th 。 CPU 时 钟 赂 期 数 
CPU 执行 时 间 一 op 


(1.1) 


串 1 章 ”计算 机 系统 概 还 


6. MIPS 和 MFLOPS `GFLOPS 、TFLOPS 、PFLOPS 
每 秒 执 行 多 少 百 万 条 指令 (Million Instructions Per Second,MIPS) 定 义 为 


3 Re X 10™ be 

每 秒 执 行 多 少 百 万 次 浮上 点 运算 (Million FLoating-point Operations Per Second,， 
MFLOPS) 定 义 为 

FLOPS 珊 行 时 间 X10 (1. 3) 

ar ape 浮 点 操作 次 数 层 

(GEFLCOPS 孤 行 时 间 又 1075 (1. 4) 


| 浮 点 操作 次 数 . 
TFLOPS = -I 1. 5) 
执行 时 间 x 107 KA) 


Ee 、 汉 扣 操作 次 数 本 
PEFLOPS 可行 时 间 又 10 (1.6) 


1.4 计算 机 的 基本 组 成 


计算 机 经 历 了 几 十 年 的 发 展 , 虽 然 性 能 越 来 越 高 ,适应 各 种 应 用 的 产品 越 来 越 丰 军 ,但 
从 其 基本 的 硬件 组 成 上 讲 ,仍然 是 采用 当初 的 冯 “， 详 依 曼 (von Neumann) 结 构 进 行 设 计 的 。 
无 论 是 巨型 机 大 型 机 还 是 小 型 机 、 微 型 机 ,它们 主要 的 不 同和 都 在 于 性 能 的 高 低 , 而 从 硬件 组 
成 上 讲 是 基本 相同 的 。 

那么 ,一 人 台 完 整 的 计算 机 主要 由 哪些 硬件 组 成 呢 ? 以 微型 机 为 例 , 通 过 对 其 进行 彻底 
“ 解 训 ”, 看 看 日 各 使 用 的 计算机 中 包 语 了 了 哪些 部 件 。 

图 1-8 是 1981 年 IBM 公司 生产 的 一 人 台 具 有 里 程 碑 意义 的 IBM PC( 今 天 讲 的 PC 或 个 
人 电脑 正 是 从 该 计算 机 的 名 字 得 来 的 ) 。 之 所 以 说 它 具 有 里 程 碑 的 意义 ,一 方面 是 因为 它 的 
推出 彻底 改变 了 人 们 使 用 计算 机 的 工作 模式 ,使 计算 机 从 神秘 的 空调 房 走 到 了 办 公 果 , 走 回 
了 家 庭 ; 男 一 方面 ,因为 它 的 廉价 和 易于 维护 ,使 计算 机 得 以 普及 ,使 计算 机 的 应 用 得 到 了 
前 所 未 有 的 发 展 。 虽 然 , 从 今天 的 角度 来 看 ,IBM PC 的 配置 会 让 人 觉得 不 可 思议 ,这 种 本 
置 的 计算 机 能 干什么 ”但 在 当时 , 它 确 实 让 很 多 人 激动 。 


* Intel 8088 CPU，4.77MHz 

* 64KB| 存 

* 640X480 分 兰 率 里 色 显示 华 
。 5.251n#Ro 


* 健 税 
"DOS 操作 系统 


图 1-8 1981 年 生产 的 IBM PC 
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再 来 看 看 我 们 今天 使 用 的 PC( 如 图 1-9 所 示 )。 多 核 CPU,DDR 内 存 ,SATA 硬盘 , 液 
品 显示 汕 ,光电 鼠标 ,人 体 工 程 学 功能 键盘 , 音 啊 系统 ,Windows 8 操作 系统 ,等 等 ,各 种 先进 
技术 让 人 眼花 综 乱 。 


* Intel 西 宕 i77iSAi3 CPU 
*4GB DDR3 内 存 
*。 1TG 7200 转 高 速 SATA 硬 骨 
“19 “宽屏 液 师 显 示 玫 
*10/100/1000M 集 成 网 卡 

a 国标 /人 体 工 学 程 功能 键盘 

山口 质 音 啊 系 统 
ER 8 操作 系统 


图 1-9 现代 PC 


从 IBM PC 到 现代 PC, 虽 然 只 有 得 短 三 十 几 年 的 时 间 ,计算机 技术 却 取 得 了 突飞猛进 
的 发 展 , 性 能 已 得 到 了 大 大 提高 。 然 而 ,从 专业 角度 看 ,它们 的 硬件 组 成 及 功能 结构 却 是 相 
同 的 。 下 面 以 现代 PC 为 例 , 对 其 进行 进一步 的 齐 析 。 

从 外 观看 ,一 台 台 式 PC 至 少 包括 机 箱 、 显 示 嚣 键盘 和 鼠标 等 (有 的 PC 还 会 配 上 音箱 
系统 ) 。 打 开机 箱 ,里面 还 有 电源 主板、 硬盘 .光驱 、 显卡. 网卡 等 ,主板 上 又 有 CPU 内存 


等 ,这 么 多 的 东西 让 人 有 眼花 综 乱 。 图 1-10 是 实际 主板 的 构成 图 。 


多 马 接口 


便 研 、 


键盘 也 标 接 口 ag 
并 行 接口 一 策划 ss : 
显示 费 接 口 


图 1-10 ”主板 构成 图 


将 以 上 所 罗列 的 设备 及 部 件 整 理 一 下 ,可 以 得 到 如 图 1-11 所 示 的 计算 机 硬件 组 成 结 
构图 。 

从 图 1-11 中 可 以 看 出 ,从 功能 结构 上 讲 , 计 算 机 人 硬件 主要 由 CPU ,存储 条、 输入 输出 接 
口 及 设备 三 大 部 分 组 成 。 而 从 设计 和 实现 上 讲 ,CPU ,存储 器 (目前 在 计算 机 中 是 以 内 存 的 
方式 出 现 的) 直接 插 在 主板 上 ,同时 在 主板 上 还 集成 了 一 些 输入 输出 接口 电路 。 显 示 器 作为 
标准 输出 设备 ,键盘 和 鼠标 则 作为 标准 输入 设备 ,分 别 与 主板 上 对 应 的 接口 相连 。 男 外 , 磁 

i 诸 兹 (第 4 章 详细 介绍 ) ,但 从 
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设备 | | 
图 1-11 计算 机 硬件 组 成 结构 


其 实 ,计算 机 的 这 种 组 成 结构 也 正 符合 其 “计算 ”的 要 求 。 人 们 为 解 算 某 一 问题 编制 程 
序 , 然 后 交 给 计算 机 运行 程序 ,并 最 终 将 运行 结果 返回 ,这 一 过 程 正 需 要 不 同 的 设备 或 部 件 
配合 完成 。 


输入 设备 将 人 们 
pA 人 


制 的 程序 和 需要 4 
给 计算 机 存 人 


妨 外 ,CPU、 存 储 可 和 输入 输出 接口 及 设备 间 需 要 进行 辑 
要 通过 某 种 方式 连接 直 
所 示 。 

总 线 是 一 组 信号 线 , 它 主要 包括 CPU、 存 储 器 和 
给 入 输出 接口 及 设备 间 需 要 进行 传输 的 数据 信和 号、 地 
址 信号 和 控制 信号 等 。 采 用 总 线 连接 方式 ,可 以 有 效 “ 一 -上 一 总 线 
减少 这 些 部 件 之 间 重 复 连 接 的 信号 线 的 数量 和 提 闹 
通信 的 效率 。 有 关 总 线 的 内 容 将 在 第 6 章 详细 介绍 ， 

在 计算 机 的 各 个 组 成 部 件 中 ,CPU 是 最 核心 的 部 
件 , 计 算 机 的 各 个 部 件 所 进行 的 所 有 操作 和 运算 都 是 | 1O 设 备 _ VO 设备 _ 
在 CPU 控制 下 完成 的 。 而 从 功能 结构 上 讲 ,CPU 又 图 1-12 计算 机 硬件 之 间 的 总 线 连接 
是 由 运算 器 和 控制 器 两 大 部 分 构成 的 。 因 此 又 可 以 
说 ,计算 机 由 五 大 部 件 构成 , 即 运算 器 控制 器 存储 器 .输入 部 件 和 输出 部 件 ，。 


据 的 通信 ,因此 ,它们 之 间 需 
来 。 在 现代 计算 机 中 , 普 裔 采用 的 是 一 种 总 线 连接 方式 ,如 图 1-12 


CPU 
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1. 运算 痪 


计算 机 的 一 个 最 大 特点 就 是 具有 很 强 的 运算 能 力 。 运 算 熏 就 是 计算 机 内 用 于 完成 各 种 
运算 的 部 件 , 其 基本 结构 如 图 1-13 所 示 。 

运算 角 中 有 一 个 核心 部 件 一 一 算术 逻辑 运算 单元 (ALU) , 它 能 完成 各 种 算术 运算 和 巡 
辑 运 算 。 最 基本 的 算术 运算 主要 包括 加 \ 减 . 乘 、 除 等 ,逻辑 运算 主要 包括 与 、 或 . 非 、 异 或 及 
移 位 运算 等 。 通 过 这 些 最 基本 的 算术 .逻辑 运算 可 以 实现 各 种 复杂 的 运算 。ALU 一 般 有 两 
个 输入 端 , 它 能 一 次 完成 两 个 操作 数 的 运算 。 男 外 在 运算 器 中 还 会 设置 一 些 通用 寄存 器 及 ， 
用 于 暂时 存放 运算 中 产生 的 中 间 结 末 。 


2. 控制 着 


控制 器 是 计算 机 的 指挥 中 心 , 它 按照 人 们 预先 编 好 的 程序 进行 工作 ,根据 程序 中 指令 的 
要 求 ,有 序 地 向 计算 机 中 各 个 部 件 发 出 控制 信号 ,使 计算 机 中 各 个 部 件 有 条 不 率 地 工作 ,从 
而 完成 指令 所 要 求 的 功能 。 控 制 器 的 基本 结构 如 图 1-14 所 示 。 


控制 信号 


控制 信号 


号 上 


图 1-13 运算 名 结构 图 1-14 ”控制 器 结构 


在 控制 部 中 主 要 包括 程序 计数 闫 (PC) .指令 寄存 希 (IR) 指令 译 码 闫 (ID) 地址 生成 需 
(AG) .地 址 寄存 大 CAR) 时 序 部 件 CCP) 和 控制 信号 产生 部 件 等 。 

存储 昭 程序 计数 般 (Program Counter, PC) 实 际 上 是 一 个 

“| | 地 址 寄存 器 ,其 中 存放 的 是 下 一 条 要 执行 的 指令 在 存 

储 器 中 的 单元 地 址 ( 见 图 1-15) 。 按 照 汉 。 诺 依 曼 存储 


人 备 癌 中 一 条 一 条 将 指令 取出 ; 
操作 系统 的 控制 下 完成 的 。 当 要 运行 一 个 程序 时 , 首 
先 由 操作 系统 将 该 程序 从 计算 机 外 部 存储 融 调 人 主 存 
储 副 中 ,然后 将 为 程序 动态 分 配 的 存储 单元 首 地 址 (程序 要 执行 的 第 一 条 指令 所 在 存储 单元 
的 地 址 ) 送 入 PC 中 ,这 样 就 开始 了 该 程序 的 执行 。 程 序 在 存储 人 中 一 般 是 按 其 编写 的 顺序 
存放 的 , 耕 当 前 执行 的 指令 是 一 条 顺序 指令 , 则 由 PC 加 1 自动 生成 一 条 指令 的 地 址 ,而 
右 当 前 执行 的 指令 是 一 条 转移 或 转子 指令 时 , 则 巾 该 指令 生成 要 转 罗 的 指令 地 址 并 送 PC。 


图 1-15 ”PC 的 功能 
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指令 寄存 髓 (Instruction Register,IR) 主 要 用 于 存放 由 PC 指 加 的 从 存储 大 中 取出 的 指 
令 代 码 。 指 令 寄存 器 一 般 为 一 个 指令 字 长 , 它 主要 由 两 个 字段 组 成 ,一 是 指令 操作 码 OP 字 
段 ; 二 是 操作 数 或 转移 地 址 Addr 字段 。OP 字段 用 于 指出 该 指令 是 一 条 什么 样 的 指令 ,如 
加 法 . 移 位 等 ; Addr 字段 根据 指令 的 不 同 功 能 有 所 不 同 , 对 于 顺序 指令 ,Addr 字段 用 于 指 
出 操作 数 的 类 型 及 存放 的 位 置 或 地 址 ,而 对 于 转移 或 转子 指令 ,Addr 字段 则 用 于 指出 要 转 
向 的 指令 的 地 址 。 

指令 译 但 埋 (Instruction Decoder,ID) 用 于 对 指令 寄存 关中 的 OP 字段 进行 译 码 ,并 将 
泽 码 结果 输出 给 控制 信号 产生 部 件 , 如 图 1-16 所 示 。 例 如 ,假设 某 计算 机 共有 64 条 指令 ， 
采用 定 长 操作 码 编 码 , 即 所 有 指令 的 OP 字段 均 为 6 位 二 进 制 , 则 ADD JMP 
该 计算 机 的 指令 译 码 器 的 一 种 简单 设计 就 是 采用 一 个 6/64 译 码 。 M9Y ,SY ， 
请, 即 6 位 输入 ,产生 64 个 输出 , 且 同 时 只 有 一 个 输出 有 效 。 在 
进行 指令 系统 设计 时 ,为 每 一 条 指令 分 配 一 个 不 同 的 6 位 二 进 制 
代码 。 当 某 条 指令 执行 时 , 译 码 器 的 输入 是 该 指令 的 6 位 OP 代 
码 , 则 其 对 应 的 输出 有 效 , 此 输出 用 于 “通知 ”控制 信号 产生 部 件 1-16 详 码 带 切 能 
当前 执行 的 是 该 指令 。 

地 址 生成 种 (Address Generator,AG) 主 要 用 于 生成 操作 数 在 存储 硕 中 的 单元 地 址 ,从 
而 为 取 该 操作 数 做 好 准备 。 为 了 编程 的 灵活 性 ,几乎 所 有 计算 机 的 指令 系统 都 提供 了 多 种 
操作 数 的 寻 址 方式 ,不 同 的 寻 址 方式 生成 操作 数 的 实际 地 址 的 方法 有 所 不 同 , 设 置地 址 
生成 器 的 目的 就 是 为 了 支持 各 种 寻 址 方式 的 实现 。 有 关 寻 址 方式 的 内 容 将 在 第 3 章 详细 
讲述 。 

地 址 寄存 盘 (Address Register,AR) 主要 有 两 个 用 途 : 一 是 用 于 存放 由 地 址 生成 套 按 
寻 址 方式 进行 计算 得 到 的 操作 数 在 存储 器 中 的 地 址 ; 二 是 用 于 存放 由 当前 转移 或 转子 指令 
产生 的 要 转 回 的 指令 的 地 址 。 对 CPU 来 说 ,无 论 是 从 存储 关中 取 指 令 还 是 取 操 作 数 ,都 属 
于 访 存 操作 。 访 存 操作 的 第 一 步 就 是 要 给 出 所 要 访问 的 存储 单元 地 址 ,而 该 地 址 就 是 由 地 
址 寄存 器 保存 的 。 

最 后 ,所 有 指令 的 执行 都 是 在 一 定 的 操作 控制 信号 的 控制 下 完成 的 ,操作 控制 信号 产生 
部 件 就 是 根据 指令 诺 码 的 结果 产生 当前 指令 执行 过 程 中 所 需 的 全 部 操作 控制 信号 ,这 些 欣 
制 信号 在 时 订 部 件 产 生 的 时 序 下 按照 一 定 的 顺序 逐个 产生 ,从 而 控制 不 同 的 部 件 完成 相应 


3. 存储 兰 


人 存储 毅 是 计算 机 重要 的 组 成 部 件 之 一 ,主要 用 来 存储 程序 和 数据 。 现 代 计 算 机 普 忆 条 
用 冯 。… 访 依 曼 计算 机 结构 ,而 汉 。 请 依 曼 计 算 机 的 特点 之 一 就 是 “存储 程序 ”。 所 谓 存 储 程 
序 是 指 : 任何 要 运行 的 程序 必须 事先 存 入 存储 各 中 ,由 CPU 从 存储 天 中 将 程序 指令 一 条 条 
取出 并 执行 。 因 此 ,存储 佛 是 现代 计算 机 不 可 或 缺 的 部 件 。 

从 物理 上 讲 ,存储 硕 是 由 具有 一 定 记 忆 功 能 的 物理 各 件 构成 的 ,如 目前 计算 机 内 存 普遍 
采用 的 半导体 存储 共和 计算 机 外 存 采 用 的 磁 介 质 存 储 表 或 光 存 储 表 等 。 这 些 物理 般 件 是 通 
过 日 喘 的 一 些 物理 特性 来 表示 和 存储 二 进 制 0、1 信息 的 。 例 如 ,在 第 4 章 将 会 讲 到 的 一 种 
静态 半导体 存储 着 , 它 的 每 个 存储 单元 电路 (存储 1 位 二 进 制 信息 ) 是 依 徘 三 极 管 的 导 通 和 
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截止 两 种 状态 来 分 别 表示 0 和 1 的 。 

从 逻辑 上 讲 ,存储 冀 是 由 一 个 个 存储 单元 构成 的 , 它 也 正 是 利用 这 一 个 个 的 存储 单元 来 
存储 或 记忆 二 进 制 信息 的 。 存 储 各 所 有 存储 单元 的 总 数 称 为 存储 冀 的 存储 容量 , 通 营 用 单 
位 KB( 千 字 世 )、 MB( 兆 字 玉 ) ,GB( 吉 和 字 方 ) 等 表示 ,存储 容量 越 大 ,表示 存储 冀 能 够 存储 记 
忆 的 信息 量 越 大 。 


4. 输入 输出 接口 与 设备 


输入 输出 系统 由 输入 输出 设备 和 与 设备 配套 的 适配器 (Adaptor) 或 接口 电路 组 成 。 

计算 机 的 输入 输出 设备 又 称 为 外 围 设备 ,它们 主要 完成 人 机 间 的 信息 交换 。 人 们 通过 
输入 设备 将 以 菏 种 形式 表示 的 信息 转换 为 计算 机 内 部 所 能 接收 和 识别 的 二 进 制 数 据 表示 
由 计算 机 运算 处 理 后 ,将 产生 的 结果 通过 输出 设备 以 人 或 其 他 计算 机 所 能 接收 和 识别 的 信 
县 形式 输出 。 现 代 计 算 机 的 标准 输入 设备 包括 键盘 、 鼠 标 等 ,标准 输出 设备 有 显示 需 等 。 除 
此 之 外 ,还 有 各 种 各 样 满足 不 同 用 途 的 输 人 输出 设备 ,如 打印 机 、 绘 图 仪 .扫描 仪 、. 光 笔 以 及 
各 种 图 像 输 入 输出 设备 .语音 输 人 输出 设备 等 。 

由 于 输入 输出 设备 种 类 繁多 ,在 人 处理 速度 、 数 据 格式 、 机 械 及 电器 特性 等 方面 差异 较 大 ， 
因此 ,CPU 与 输入 输出 设备 间 的 数据 交换 通 稼 是 通过 相应 输入 输出 适 配 闫 (又 称 输入 输出 
接口 ) 来 实现 的 。 例 如 ,CPU 对 显示 天 的 输出 控制 就 是 通过 显卡 (又 称 显 示 融 适 配 卡 ) 来 完 
成 的 。 

除了 上 述 各 部 件 外 ,计算 机 系统 中 还 必须 有 总 线 。 系 统 总 线 是 构成 计算 机 系统 的 骨架 ， 
是 多 个 系统 部 件 之 间 进 行 数据 传送 的 公共 通路 。 侍 助 系统 总 线 , 计 算 机 在 各 系统 部 件 之 间 
实现 传送 地 址 .数据 和 控制 信息 的 操作 。 


间 册 拓展 


站 . 诺 依 曼 和 非 汉 “. 诺 依 曼 体系 结构 

在 最 早期 的 电子 计算 机 中 ,编程 就 是 利用 各 种 导线 进行 接 插 连 线 。 由 于 没有 计算 机 分 
层 的 概念 ,对 早期 的 计算 机 每 进行 一 次 编程 都 是 一 项 非常 大 的 布线 工程 ， 

在 ENIAC 计算 机 研制 的 同时 ,站 “。 诺 依 曼 与 莫 尔 小 组 也 在 合作 研制 EDVAC 计算 机 ,在 
EDVAC 计算 机 中 首次 采用 了 存储 程序 的 思想 ,这 种 采用 存储 程序 的 计算 机 就 称 为 站 。 诺 
依 曼 计算 机 。 冯 “。 诺 依 受 结构 的 计算 机 具有 以 下 一 些 特 点 : 

(1) 计算 机 由 运算 器 、 控 制 器 存储器、 输入 设备 和 输出 设备 五 部 分 组 成 。 

(2) 采用 存储 程序 的 方式 ,要 执行 的 程序 和 数据 事先 存放 在 存储 器 中 。 

(3) 采用 二 进 制 编码 表示 数据 。 

(4) 程序 是 指令 的 集合 ,指令 在 存储 器 中 按 执行 顺序 存放 。 

虽然 现代 计算 机 普遍 采用 冯 。 诺 依 曼 体系 结构 设计 ,但 由 于 冯 。 诺 依 曼 计算 机 中 CPU 
与 存储 器 之 间 单 一 通道 这 一 瓶颈 问题 使 得 计算 机 性 能 的 提高 受到 了 限制 ,因此 ,人 们 不 断 努 
力 ,试图 突破 冯 “。 诺 依 曼 结 构 的 限制 ,从 而 在 历史 上 也 曾 出 现 过 一 些 非 冯 “。 诺 依 曼 结构 计算 
机 的 研究 或 对 冯 。 诺 依 曼 结 构 的 一 些 改进 ,如 利用 人 脑 模 型 的 思想 作为 计算 模式 的 神经 网 
络 计 算 机 、 利 用 生物 学 和 DNA 演化 的 思想 开发 的 基因 和 算法、 量子 计算 和 并 行 计算 机 等 。 在 
这 些 新 的 体系 结构 中 ,并 行 计算 的 概念 是 目前 最 成 功 和 最 流行 的 。 
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1 .5 ”计算 机 语言 


计算 机 语言 是 人 与 计算 机 进行 交流 的 语言 ,通过 计算 机 语言 ,人 们 可 以 告知 或 命令 计算 
需要 做 什么 ,要 完成 什么 样 的 工作 等 。 计 算 机 语言 主要 用 于 提供 人 们 编写 计算 机 软件 程 
夺 , 因 此 ,又 称 为 程序 设计 语言 。 
计算 机 硬 言 按照 与 便 件 相关 程度 由 局 到 低 分 为 机 人 盘 语 言 \ 汇 编 语 言 和 局 级 语言 。 机 各 
语言 属于 人 刹 件 机 舌 级 语言 ,是 一 种 用 二 进 制 代 人 码 表 示 的 能 够 被 计算 机 便 件 卫 接 识 别 和 执行 
的 语言 。 不 同 计算 机 (主要 是 CPU) 的 机 责 语 言 是 不 同 的 。 巾 于 机 豆 霹 言 不 便于 程序 员 擎 
握 和 使 用 ,因此 现在 很 少 使 用 机 各 语言 编制 程序 ， 
汇编 语言 是 一 种 及 用 助 记 和 从 表示 的 程序 设计 二 言 。 汇 编 语 言 的 指令 和 机 徊 语言 的 指令 
在 很 大 程度 上 是 一 一 对 应 的 , 它 不 能 馈 计 算 机 的 便 件 下 接 识别 ,但 却 便于 程序 员 记 忆 。 用 汇 


编 语言 


用 汇编 语言 编写 程序 同样 比较 复杂 , 且 所 编制 的 程序 代码 难以 移植 。 

高 级 语言 是 与 机 器 无 关 的 程序 设计 语言 , 它 具 有 更 强 的 表达 能 力 , 采 用 一 种 更 接近 上 自然 
的 和 表达 方式 表示 数据 的 运算 和 程序 的 控制 结构 等 ,使 程序 员 容 易学 习 和 擎 握 。 目 前 的 应 用 软 
件 主要 使 用 高 级 语言 编制 实现 。 随 着 Windows 系统 的 推出 和 近 些 年 多 媒体 技术 的 应 用 、 发 
展 , 高 级 语言 正 问 着 面向 对 象 、 可 视 化 的 方向 发 展 ,使 得 程序 设计 的 效率 更 高 。 

在 各 种 层次 的 计算 机 语言 中 ,机 器 语 言 是 硬件 直接 识别 的 语言 ,其 他 各 种 语言 可 看 成 相 
应 的 虚拟 机 的 机 咒语 言 。 某 一 层次 的 虚拟 机 能 够 直接 理解 的 语言 称 为 该 层 的 虚拟 机 语言 。 
虚拟 机 语言 层次 越 高 ,语言 的 表达 能 力 就 越 强 。 处 在 某 一 级 虚拟 机 的 程序 员 只 需 知 道 这 一 
级 的 语言 及 虚拟 机 属性 ,其 下 层 的 特性 无 须知 道 , 即 下 层 的 特性 对 程序 员 来 说 是 透明 的 。 

用 程序 设计 语言 编写 的 程序 称 为 源 程 序 。 高 级 语言 的 源 程序 可 以 通过 两 种 方式 转换 成 
机 岩 语言 程序 : 一 种 是 通过 编译 程序 在 运行 之 前 将 源 程序 转换 成 机 器 语言 程序 ; 另 一 种 是 
通过 解释 程序 进行 解释 执行 。 


1.6 计算 机 系统 的 分 层 组 织 结构 


从 一 般 使 用 者 的 角度 来 看 ,计算 机 系统 是 由 硬件 和 软件 组 成 的 ,而 计算 机 软件 根据 其 在 

-机 系统 中 所 起 的 作用 又 可 进一步 分 为 系统 软件 和 应 用 软件 。 系 统 软件 是 指 能 够 对 计算 

资源 进行 管理 ,对 用 户 方 便 使 用 计算 机 硬件 资源 提供 服务 的 软件 ,其 核心 就 是 操作 系 

统 。 应 用 软件 则 是 人 们 使 用 各 种 计算 机 语言 为 解决 各 种 应 用 问题 而 编制 的 程序 。 因 此 ,从 

这 一 层面 上 看 ,计算 机 系统 目下 而 上 可 以 看 成 由 三 个 层次 构成 , 即 计 算 机 人 硬件 .系统 软件 和 
应 用 软件 ,下 层 为 上 层 功能 的 实现 提供 支持 。 

而 从 计算 机 设计 者 的 角度 看 ,计算 机 系统 可 以 进一步 划分 为 不 同 的 层次 来 实现 其 功能 。 

这 种 划分 可 以 看 成 概念 上 的 划分 ,但 却 是 十 分 有 意义 的 。 可 以 设想 计算 机 是 按照 不 同 的 层 

次 结构 来 建造 的 。 这 里 的 每 一 个 层次 都 实现 某 项 特定 的 功能 ,并 有 一 个 特定 的 假想 机 上 需 与 
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之 对 应 。 对 应 计算 机 的 每 一 个 层次 的 这 种 假想 机 器 称 为 虚拟 机 。 每 一 层 的 虚拟 机 都 执行 自 
己 特 有 的 指令 集 ,必要 时 还 可 以 调用 较 低层 次 的 虚拟 机 来 完成 各 种 任务 。 如 图 1-17 所 示 是 
一 个 业界 普遍 接受 的 代表 不 同 抽象 的 虚拟 机 器 的 计算 机 组 织 结构 层次 图 ， 


图 1-17 计算 机 系统 的 分 层 组 织 结构 


第 6 层 是 用 户 层 ,也 是 面 同一 般 用 户 的 层次 , 换 名 话说, 一般 用 户 在 使 用 计算 机 时 所 看 
见 的 就 是 这 一 层次 。 在 这 一 层次 上 ,用 户 可 以 运行 各 种 应 用 程序 ,如 字 人 处 理 程序 、 制 表 程 序 、 
财务 处 理 程序 ,游戏 程 订 等 。 对 用 户 层 而 言 ,其 他 各 较 低 的 层次 可 以 是 不 可 见 的 ,也 就 是 说 ， 
用 户 不 必 了 解 各 底层 是 如 何 实现 的 。 

第 5 层 是 高 级 语言 层 , 它 由 各 种 高 级 语言 组 成 ,如 C、C++、Java、Web 编程 语言 等 。 这 
些 高 级 语言 提供 该 层 用 户 为 完成 菜 一 特定 任务 而 编写 高 级 语言 程序 。 一 方面 ,所 编写 的 这 
些 高 级 语言 程序 提供 给 上 层 用 户 层 的 用 户 使 用 ,为 一 方面 这 些 高 级 语言 程序 是 通过 编译 或 
解释 成 低级 语言 来 实现 的 。 虽 然 使 用 这 些 高 级 语言 编写 程序 代码 的 程序 员 需 要 了 解 所 使 用 
语言 的 语法 ,语义 及 各 种 语句 等 ,但 这 些 语法 .语义 的 实现 及 语句 的 执行 过 程 对 他 们 来 讲 是 
透明 的 。 

第 4 层 是 汇编 语言 层 , 它 包括 各 种 类 型 的 汇编 语言 。 每 一 台 计 算 机 都 有 上 月 己 的 汇编 语 
言 , 上 层 的 高 级 语言 首先 被 翻 详 成 汇编 语言 , 笛 进 一 步 翻 译 成 计算 机 直接 识别 的 机 骼 语言 。 
计算 机 通过 执行 机 天 霹 言 程序 来 最 终 完 成 用 户 所 要 求 的 功能 。 

第 3 层 是 系统 软件 层 , 其 核心 就 是 操作 系统 。 操 作 系 统 对 用 户 程序 使 用 计算 机 的 各 种 
资源 (CPU 存储 天 .输入 输出 设备 等 ) 进 行 管理 和 分 配 。 例 如, 当 某 一 用 户 程 序 需要 运行 
时 , 痛 先 由 操作 系统 将 其 调 入 内 存 中 ,这 其 中 需要 操作 系统 为 其 分 配 内 存 空间 进行 存储 。 青 
如 某 程序 需要 使 用 某 一 输出 设备 进行 结果 的 输出 时 ,需要 操作 系统 为 其 提供 对 该 设备 的 控 

第 2 层 是 机 冀 层 ,这 是 面 同 计算 机 体系 结构 设计 者 的 层次 。 计 算 机 系统 设计 者 自 先 要 
确定 计算 机 的 体系 结构 ,如 计算 机 的 硬件 包含 哪些 部 件 , 采 用 什么 样 的 连接 结构 和 实现 技术 
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。 在 这 一 层次 上 提供 的 是 机 咒语 言 ,也 是 机 器 唯 一 能 直接 识别 的 语言 ,其 他 各 种 语言 的 程 
序 最 终 都 必须 翻译 成 机 需 语 言 程 序 , 由 计算 机 通过 其 人 硬件 实现 相应 的 功能 。 

第 1 层 是 控制 层 , 这 一 层 的 核心 是 计算 机 硬件 控制 单元 。 控 制 单 元 会 逐条 接收 来 自 上 
层 的 机 画 指 令 ,然后 分 析 详 码 ,产生 一 系列 的 操作 控制 信号 ,并 由 这 些 控 制 信号 控制 下 层 的 
逻辑 部 件 按照 一 定 的 时 间 顺 序 有 序 地 工作 。 

第 0 层 是 数字 逻辑 层 , 在 这 里 所 面 对 的 是 计算 机 系统 的 物理 构成 : 各 种 逻辑 电路 和 连 
接线 路 ,它们 是 组 成 计算 机 硬件 的 基础 。 

计算 机 系统 的 各 个 层次 并 不 是 孤立 的 ,而 是 互相 关联 、 互相 协作 的 。 一 般 来 讲 , 下 层 为 
上 层 提 供 服务 或 执行 上 层 所 要 求 的 功能 ,而 上 层 通过 使 用 下 层 提 供 的 服务 完成 一 定 的 功能 。 
计算 机 这 种 层次 划分 的 好 处 是 : 某 一 个 层次 的 设计 者 可 以 专注 于 该 层 功 能 的 实现 ,通过 条 
用 各 种 技术 ,提高 各 层次 的 性 能 ,从 而 提高 计算 机 系统 整体 的 性 能 。 

从 功能 上 讲 ,任何 可 以 利用 软件 实现 的 功能 也 可 以 利用 硬件 实现 ,反之 ,任何 可 以 利用 
硬件 实现 的 功能 同样 也 可 以 利用 软件 实现 ,这 就 是 所 谓 的 硬件 和 软件 等 效 原 理 。 计 算 机 中 
的 任何 操作 可 以 由 软件 实现 ,也 可 以 由 人 硬件 实现 , 某 一 人 台 计 算 机 功能 是 采用 硬件 实现 还 是 采 
用 软件 实现 ,取决 于 计算 机 的 性 能 价格 比 。 当 研制 一 人 台 计 算 机 的 时 候 , 设 计 者 必须 明确 软 硬 
件 的 功能 划分 。 随 着 大 规模 集成 电路 和 计算 机 体系 结构 的 发 展 , 由 硬件 实现 的 功能 范围 逐 
步 扩 大 ,这 也 就 使 计算 机 的 处 理 速 度 越 来 越 快 ,性 能 越 来 越 高 。 

目前 ,计算 机 在 机 融 语 言 级 是 由 硬件 直接 实现 , 即 由 人 硬件 实现 对 机 天 指令 的 解释 和 执 

。 随 着 发 展 , 今 后 的 计算 机 将 由 硬件 直接 实现 更 高 级 的 功能 ,如 通过 硬件 直接 解释 执行 高 

beeoontetdat le 圣 过 编译 程序 的 人 处理, 因此 传统 的 软件 部 分 今后 完全 有 可 能 “ 固 
化 ”, 即 通过 所 谓 的 固件 方式 实现 。 


本 音 小 结 


章 主要 讲述 了 以 下 内 容 : 

(1) 计算 机 的 发 展 历程 。 从 机 械 计 算 机 发 展 到 电子 计算 机 ,电子 计算 机 按 所 使 用 的 电 
子 元 天 件 划分 年 代 ( 电 子 管 计算 机 、 品 体 管 计算 机 、 中 小 规模 集成 电路 计算 机 和 大 规模 超大 
规模 集成 电路 计算 机 年 代 ) 。 

(2) 计算 机 的 种 类 。 按 照 1989 年 由 IEEE 科学 巨型 机 委员 会 提出 的 运算 速度 分 类 法 ， 
将 计算 机 分 为 巨型 机 .大 型 机 、 小 型 机 .工作 站 和 微型 计算 机 。 根 据 计 算 机 的 综合 性 能 指标 ， 
将 计算 机 分 为 高 性 能 计算 机 、 微 型 计算 机 工作站、 服务 毅 和 磐 人 式 计算 机 。 

(3) 计算 机 的 性 能 指标 。 主 要 包括 吞吐 量 . 啊 应 时 间 ,CPU 时 钟 周 期 \ 主 频 、CPI、CPU 
执行 时 间 ,MIPS、MFLOPS、GFLOPS、TFLOPS、PFLOPS 等 。 

(4) 计算 机 的 硬件 组 成 。 主 要 包括 中 央 处 理 器 (CPU)、 存 储 器 和 输入 输出 系统 ,CPU 
主要 由 运算 器 和 控制 器 组 成 ,这 也 是 汉 ，。 诺 依 曼 提出 的 计算 机 组 成 结构 。 

(5) 计算 机 语言 。 由 低 到 高 分 为 机 兹 语言 ,汇编 语言 和 高 级 语言 。 

(6) 计算 机 的 层次 结构 。 从 计算 机 的 基本 硬件 开始 分 为 数字 逻辑 层 、 控 制 层 .机 器 层 、 
系统 软件 层 .汇编 语言 层 .高 级 语言 层 和 用 户 层 。 
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1. 集成 电路 2. 系列 3. 通用 机 4. 虚拟 机 
二 、 选 择 题 
1. 世界 上 第 一 台电 子 计 算 机 ENIAC 中 使 用 的 基本 元 器 件 是 ( ) 。 
A. 机 械 少 置 B. 电 了 于 管 C. 疝 体 管 D. 集成 电路 
2. 现代 计算 机 中 使 用 的 基本 元 疮 件 是 ( ) 。 
A. 电子 管 B， 品 体 管 C. SSI 和 MSI D. LSI 和 VLSI 
.按照 1989 年 IEEE 科学 巨型 机 委员 会 提出 的 运算 速度 分 类 法 ,计算 机 种 类 中 不 包 
) 。 
A. 巨型 机 B. 小 型 机 C. 小 巨型 机 D. 
4. 运算 硕 中 一 般 应 包含 ( ) 。 
A. ALU 和 寄存 髓 组 B. ALU 和 IR 
C. ALU 和 DR D. ALU 和 AR 
5. 冯 。 诺 依 曼 计算 机 工作 方式 的 基本 特点 是 ( 后 
A. 多 指令 流 单数 据 流 B. 多 指令 流 多 数据 流 
C. 堆栈 操作 D. 按 地 址 访问 并 顺序 执行 指令 
、 综 合 题 
. 什么 是 摩尔 定律 ? 它 对 计算 机 集成 电路 技术 的 发 展 有 何 影 啊 ? 
解释 SSI.MSI .LSI 和 VLSI 的 区 别 。 
. 计算 机 是 如 何 进 行 分 类 的 ? 
. 计算 机 从 硬件 上 讲 包 括 哪些 主要 部 件 ? 
. 阐述 CPU 中 的 运算 器 和 控制 器 的 基本 结构 。 
.指令 译 码 善 是 如 何 工作 的 ? 
. 曾 述 冯 ，… 请 依 曼 体系 结构 的 特点 。 
. 计算 机 是 如 何 划 分 层次 的 ? 划分 层次 有 何 意义 ? 
.什么 是 硬件 和 软件 等 效 原理 ? 
.查阅 资料 ,人 简要 概括 一 下 我 国 在 处 理 右 心 片 技术 领域 的 发 展 情况 。 
. 查阅 资料 ,简要 概括 当前 计算 机 集成 电路 技术 在 芯片 集成 度 方面 发 展 的 情况 。 
.查阅 资料 ,进一步 说 明 计 算 机 系统 性 能 评测 的 方法 和 指标 体系 。 
13. 衡量 CPU 性 能 指标 的 一 个 参数 是 CPI(Cycles Per Instruction) ,查阅 有 关 资 料 , 丁 


微型 机 


[1 


解 CPI 的 含义 。 


14. 衡量 CPU 性 能 指标 的 一 个 参数 是 MIPS( 每 秒 百 万 条 指令 ) ,查阅 有 关 资 料 , 了 解 


MIPS 的 含义 。 


15. 假设 您 现在 要 为 上 月 已 购置 一 人 台 计 算 机 ,请 说 明 您 使 用 这 人 台 计 算 机 的 用 途 ,并列 出 您 


所 知道 的 现在 计算 机 的 性 能 配置 情况 (如 CPU .主板 .内 存 等 ) 。 


据 的 机 器 级 表示 及 运算 


早期 的 计算 机 主要 用 于 科学 计算 ,以 帮助 人 们 提高 计算 的 速度 ,为 此 在 计算 机 中 必须 使 用 
一 定 的 方法 表示 数值 数据 ,并 完成 各 种 运算 。 紧 接着 ,人 们 使 用 计算 机 来 处 理 各 种 文字 信息 ， 
以 提高 对 文本 处 理 的 效率 ,为 此 在 计算 机 中 又 必须 使 用 一 定 的 方法 表示 字符 等 非 数 值 数据 。 
随 着 计 鼻 机 在 各 种 应 用 领域 的 发 展 , 计 和 机 所 能 角 示 的 信息 种 类 越 来 越 多 ,如 声音 .图 形 、 图 像 、 
视频 和 动画 等 。 但 无 论 什么 样 的 信息 或 数据 ,在 计算 机 中 都 是 通过 二 进 制 编码 的 方法 来 表示 的 。 

本 章 首 先 介 绍 二 进 制 等 基本 的 进位 记 数 制 ; 再 介绍 在 计算 机 中 是 如 何 对 人 们 日 常 处 理 
的 数值 数据 和 非 数 值 数 据 ( 主 要 包括 字符 、 汉字 等 ) 进 行 二 进 制 编码 表示 的 ; 然后 介绍 数值 
数据 在 计算 机 中 的 二 进 制 运算 方法 和 实现 ; 最 后 介绍 对 计算 机 中 的 数据 在 传递 过 程 中 产生 
的 差错 进行 检测 而 使 用 的 数据 校 验 码 。 


2.1 数 制 及 转换 


生活 中 的 


数值 计算 是 采用 十 进 制 进行 的 ,而 在 计算 机 中 采用 的 却 是 二 进 制 。 另 外 ,为 了 


制 ,如 十 六 进 制 、 八进制 等 


方便 地 表示 二 进 制 , 人 们 又 设计 了 其 他 进位 记者 
2.1.1 进位 记 数 制 


这 ,K 进 制 数 的 基数 
位 计 满 K 就 向 其 高 位 进 1, 即 “着 K 进 1”。 
进位 计数 制 中 每 位 数字 符号 所 表示 的 数值 ,等 于 该 数字 符号 值 


{ 计 法 为 i 
数 半 ee 依次 为 一 1 一 2、… 如 ’ 减 。 

任何 进 制 数 的 值 剖 可 以 表示 成 该 进 制 数 中 各 位 数字 符号 值 与 相应 位 权 乘 积 的 累加 形 
式 , 该 形式 称 为 按 权 展 开 的 多 项 式 和 。 一 个 进 制 数 (N)x ,用 按 权 展开 的 多 项 式 和 形式 可 
表示 为 
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(N)k 一 Di 天 ”十 DRK" T+ DK 十 DoK" 
+DK +DsK ?+*…+D ,KRK™ (2. 1) 
例如 ,十 进 制 数 (123. 4)ie 可 表示 为 
(123.4)1o 一 1X102 十 2X10 十 3X10" 十 4X107 
任何 进 制 数 按 权 展开 的 多 项 式 和 的 值 ,就 是 该 进 制 数 所 对 应 的 十 进 制 数 的 从。 换言之 ， 
任何 进 制 与 十 进 制 数 的 转换 只 需求 该 进 制 数 的 按 权 展开 的 多 项 式 和 的 值 即 可 。 


1. 二 进 制 数 


计算 机 内 部 使 用 的 是 二 进 制 。 所 有 的 数值 数据 和 非 数 值 数 
数字 符号 组 合 而 成 ,它们 统称 为 ”二进制 代码 ”。 二 进 制 的 基数 
号 ,计数 “着 2 进 1”, 用 按 权 展开 的 多 项 式 和 形式 可 表示 为 
(N), =D,2" + 2"-1D, 十 … 十 2D + 2°D, 
十 27D_i 十 2 Ds 十 … 十 2™"D.， (2. 2) 

例如 ,二 进 制 数 (1011. 1), 可 表示 为 

(1011.1)， 一 1X2 十 0X22 十 1X2 十 1X20 十 1X 2 
计算 机 内 部 采用 二 进 制 表示 ,具有 以 下 优点 : 

(1) 技术 容易 实现 。 实 际 上 ,一 个 二 进 制 “位 ?0 或 1 在 计算 机 中 是 通过 电子 器 件 的 两 种 
状态 来 表示 的 ,如 电子 开关 的 “ 开 ? 和 ”* 关 ”三 极 管 的 " 寻 通 ”和 ”“* 鹤 止 电位 的 “高 2 和 ”“ 低 ”等 
两 种 状态 ,而 这 正 符合 电子 着 件 的 状态 特性 。 

(2) 运算 规则 人 简单。 两 个 一 位 二 进 制 数 的 加 、 减 运算 规则 各 仅 有 4 种 ,如 加 法 : 

0 二 0 二 0 
0 十 1 二 1 
1 十 0 一 1] 
1 十 1 一 0( 回 高 位 进 1) 
(3) 与 逻辑 量 吻合 。 逻 辑 量 1.0 表示 一 个 事物 的 正 \ 反 两 个 方面 ,如 是 / 非 、 真 / 


2. 十 六 进 制 数 


二 进 制 数 位 数 多 、 数 字符 号 单调 ,不 便于 书写 和 记忆 。 在 计算 机 应 用 中 ,通常 用 与 二 进 
制 数 有 徐 单 对 应 关系 的 十 六 进 制 效 作为 数据 的 书写 形式 。 

十 六 进 制 的 基数 为 16 ,由 0 一 9、A 一 F 共 16 个 数字 字母 符号 组 成 。 其 中 ,0 一 9 共 10 
个 数字 符号 ,含义 与 十 进 制 数 相 同 ,A 一 丰 共 6 个 字母 符号 的 值 分 别 对 应 十 进 制 数 的 10 一 
15, 计 数 “ 才 16 进 1”, 用 按 权 展开 的 多 项 式 和 形式 可 表示 为 

(N)i =16"D, -1671D, 十 … 十 161D 十 16"D， 
十 167D 十 16 万 ,十 六 十 16 万 _ (2. 3) 

例如 ,十 六 进 制 数 (28A. C)is 可 表示 为 


(28A.C)1e = 2X16*+8X16' 二 10X16 十 12 X167 


3. 八进制 数 


早期 也 常用 八进制 数 作为 计算 机 应 用 中 数据 的 书写 形式 。 
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八进制 的 基数 为 8, 由 0 一 7 共 8 个 数字 组 成 ,计数 
形式 可 表示 为 


逢 8 进 12, 用 按 权 展开 的 多 项 式 和 


(N)s 一 8 让。 十 8 也 十 … 和 十 8 十 8 
十 8 DPI 十 8 十 … 十 8 万 _， (2 4) 
例如 ,八进制 数 (35. 7)s 可 表示 为 
(35.7)s 一 3X8 十 5XX8 十 7X8 


2.1.2 数 制 的 转换 
1. 二 进 制 数 .十 六 进 制 数 转换 成 十 进 制 数 


如 前 所 述 , 任 何 进 制 数 只 要 求 得 其 按 权 展开 的 多 项 式 之 和 ,该 和 值 便 是 对 应 的 十 进 制 
笋 。 所 以 ,二进制 数 或 十 六 进 制 数 转 换 为 十 进 制 数 可 以 使 用 以 下 的 “加 权 求 和 法 ”。 

具体 方法 为 : 将 要 转换 的 二 进 制 数 或 十 六 进 制 数 表 示 成 按 权 展 开 的 多 项 式 和 的 形式 ， 
然后 逐 项 相 加 ,所 得 的 和 值 便 是 对 应 的 十 进 制 数 。 

【 例 2.1】 将 二 进 制 数 (1011. 1), 转 换 成 对 应 的 十 进 制 数 。 

解 : (1011.1), 二 1X2 十 0X2? 十 1 X2! 十 1 X2° 十 1 X27"! 二 11.5 

【 例 2.2】 将 十 六 进 制 数 (3C. 8)16 转 换 成 对 应 的 十 进 制 数 。 

解 . (3C. 8) 一 3X161 十 12X16" 十 8X16-1! 一 60.5 


2. 十 进 制 数 转 换 成 二 进 制 数 


具体 方法 为 : 将 要 转换 的 十 进 制 整 数 除 以 二 进 制 的 基数 2, 取 商 的 余数 作为 二 进 制 整 数 
最 低位 的 系数 开 , ,继续 将 商 的 整数 部 分 除 以 2, 再 取 商 的 余数 作为 二 进 制 整数 次 低位 的 系 
数 天 ,… ,这 样 依 次 相 除 ,直至 商 为 0 为 止 ,最 后 一 位 余数 作为 二 进 制 整数 最 高 位 的 系数 
K,。 余 数 序 列 K,K,_1…KiK。 便 构 成 了 对 应 的 二 进 制 数 。 
【 例 2.3】 将 十 进 制 数 43 转换 成 对 应 的 二 进 制 数 。 
解 : 


0 hs 


] 9 
2| 过 | 用; 
| 


所 以 ,(43) 一 (101011)，。 
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具体 方法 为 : 将 要 转换 的 十 进 制 小 数 部 分 乘 以 二 进 制 的 基数 2, 取 积 的 整数 部 分 作为 二 
中 小数 的 最 高 位 的 系数 天- ,继续 将 积 的 小 数 部 分 乘 以 2, 再 取 积 的 整数 部 分 作为 二 进 制 
大 的 系 效 天 -，,…, 这 样 依 次 相 乘 ,直至 积 的 小 数 部 分 为 0 或 达到 所 需 精度 为 止 , 最 后 
一 位 积 的 整数 部 分 作为 二 进 制 小 数 最 低位 的 系数 天 -。。 积 的 整数 部 分 序列 0. 天 -天 … 
氏 _ Hi 天。 便 构 成 了 对 应 的 二 进 制 数 。 
【 例 2.4】 将 十 进 制 数 0. 6875 转换 成 对 应 的 二 进 制 数 。 
解 : 


0.6875 积 的 整数 部 分 二 进 制 数位 
x 2 
] .3 7 ] kK 
D0.375 


所 以 ,(0.6875)io 王 (0. 1011)，。 

进行 数 制 转 换 时 ,整数 部 分 经 转换 后 必定 仍 为 整 效 
以 ,对 于 既 有 整数 部 分 ,又 有 小 数 部 分 的 十 进 制 数 
一 起 即 为 所 转换 的 丝 未 。 


,小数 部 分 经 转换 后 也 仍 为 小 数 。 所 
;可 按 上 述 方法 分 别 进行 转换 ,然后 组 合 在 


3. 二 进 制 数 与 十 六 进 制 数 的 相互 转换 


十 六 进 制 数 与 二 进 制 数 存在 看 简单 的 转换 关系 ,每 1 位 十 六 进 制 数 正好 大 
刘 数 ,它们 的 对 应 关系 如 表 2-1 所 示 。 
表 2-1 十 六 进 制 数 和 二 进 制 数 的 对 应 关系 

十 六 进 制 二 进 制 十 六 进 制 二 进 制 
UUUU0 
0001 
0010 
0011 
0100 
0101 
0110 
0111 


“EEC 可 
TT NW 0 % 
Fe 
jp 
OO 
Cd 


由 于 1 位 十 六 进 制 数 正 好 对 应 4 位 二 进 制 数 , 所 以 二 进 制 数 转 换 成 十 六 进 制 数 时 ,只 要 
以 小 数 点 为 界 ,整数 部 分 回 左 ,小 数 部 分 回 布 分 成 4 位 一 组 ,各 组 分 别 用 对 应 的 1 位 十 六 进 
让 数 表 示 , 即 可 得 到 所 求 的 十 六 进 制 数 。 两 涉 的 分 组 不 足 4 位 时 ,在 小 数 点 左边 的 高 位 和 小 
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数 点 右边 的 低位 可 用 0 补足 。 

【 例 2.5】 将 二 进 制 数 1011010. 10111 转换 成 对 应 的 十 六 进 制 数 。 

解 : 在 二 进 制 数 1011010. 10111 小 数 点 左边 的 高 位 补 1 个 0， 小 数 点 右边 的 低位 补 =: 
0, 则 

1011010. 10111 二 0101 1010. 1011 1000 

i 
5 A 8 

所 以 ,(1011010. 10111); = 二 (5A. B8)16。 

同 理 ,将 十 六 进 制 数 的 每 1 位 转换 成 对 应 的 4 位 二 进 制 数 , 便 可 实现 十 六 进 制 数 到 二 i 


大 渤 制 吉 与 二 进 制 数 之 间 的 转换 方法 和 十 六 进 制 数 与 二 进 制 数 之 间 的 类 似 , 所 不 同 的 
只 是 1 位 八进制 数 对 应 3 位 二 进 制 数 。 

至 于 十 六 进 制 与 十 进 制 数 之 问 的 转换 ， 同样 可 用 按 权 展开 的 多 项 式 之 和 ,以 及 整数 部 分 
用 “ 除 基 取 余 ”法 .小 数 部 乘 基 取 副 法 及 实现 ， 不 过 ,此 时 的 基数 为 16。 当 然 , 更 简单 
实用 的 方法 是 , 借 二 进 制 数 人 “十 六 一 二 二 十 ”的 转换 方法 来 实现 。 


知识 拓展 


二 进 制 的 游戏 
为 了 加 深 对 二 进 制 的 印 巢 ,我 们 来 做 一 个 游戏 。 
拿 出 一 张 纸 ,假设 这 张 纸 足 够 大 。 将 它 对 折 , 再 对 折 , 再 对 折 ,……*, 共 对 折 32 次 ,那么 
设想 一 下 ,对 折 后 的 纸 会 有 多 厚 呢 ? 
我 们 现在 来 计算 一 下 ,也许 结果 会 出 乎 预料 ,让 你 大 跌眼镜 。 
一 张 善 通 纸 的 厚度 大 约 0.04mm, 也 即 4X10-5m。 将 纸 对 折 一 次 后 共有 2 张 纸 , 再 对 
折 后 共有 4( 即 2 关 ) 张 纸 , 再 对 折 后 共有 8( 即 2”) 张 纸 …… 对 折 32 次 后 共有 2” 张 纸 。 
20 — 1024 > 1000 = 10 
220 ~ 10° 
230 -~ 10° 
2” 4X10’ 
因此 ,经 32 次 对 折 后 的 纸 的 厚度 约 为 
(4X10”)X(4X10 )m 一 1.6X10”m 


即 1600km。 
实际 上 ,二 十进制 的 指数 间 存 在 以 下 对 应 关系 . 
10* = 2™ 
7 一 ]g2 一 30lg2、%30X0.3013 二 9 


2.2 数值 数据 的 机 器 表示 


数值 数据 是 一 种 有 正 负 之 分 的 带 符号 数 ,在 日 常生 活 中 ,通常 用 正 号 十 表示 正 数 ,用 负 
号 一 表示 负数 。 数 值 数 据 的 符号 连同 其 数值 部 分 一 起 编码 成 二 进 制 数 ,不 同 的 编码 形式 产 


29 


WW 
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生 了 不 同 的 机 器 表示 法 。 
2.2.1 数据 的 机 天 数 表示 


所 谓 数据 的 机 豆 数 表示 是 指 计 算 机 人 硬件 能 够 御 接 表示 、 存储 和 处 理 的 数据 形式 。 数 值 
数据 是 市 符号 数 , 即 有 正 负 之 分 。 在 计算 机 中 , 数 的 人行 号 (十 或 一 ) 和 数 的 值 一 样 部 要 及 用 二 
进 制 0、1 编码 。 对 数值 数据 的 编码 表示 第 用 的 有 原 人 码 、 补 人 码 、 反 人 码 和 移 人 码 表 示 等 。 这 几 种 表 
不 法 都 将 数据 的 符号 数码 化 。 为 了 区 分 一 般 书 写 时 表示 的 数 和 机 舌 中 编码 表示 的 数 , 称 前 
者 为 丰 值 ,后 者 为 机 帮 数 。 机 可 数 包 含 两 部 分 : 从 号 位 和 数值 部 分 。 


1. 原 码 表示 法 
原 码 表示 法 是 一 种 比较 直观 的 表示 方法 ,其 具体 表示 方法 是 . 符号 位 表示 该 数 的 符号 ， 
正 ( 十 ) 用 *0? 表 示 , 负 (一 ) 用 1? 表示 ,而 数值 部 分 保持 与 其 直 值 相同 。 


设 纯 小 数 的 原 人 码 形 式 为 z+ 二 xo. XIX2…X,， 则 原 码 表示 的 定义 为 
es 1 二 工 衬 0 


[xX 二 (2.5) 


] 一 过 一 1 十 | 过 | 0 三 工 二 一 1] 
式 中 [xz] 是 机 帮 数 ,zx 是 真 什 。 
【 例 2.6】 xz 二 十 0.1001, 则 [zj 二 0. 1001; 
r=—0.1001,; 则 [x gs 二 1. 1001，。 
设 纯 整数 的 原 人 码 形 式 为 二 zox xo…X,,， 则 原 人 码 表 示 的 定义 为 


2" 二 工 宇 0 
[xjm=. (2.6) 
2 | 


原 人 码 表 示 法 有 两 个 特点 : 
1) 零 的 表示 有 “十 0” 和 “一 0” 之 分 , 故 有 两 种 形式 : 
[ 十 0 奈 一 0.000…0 
[一 0] 原 三 1.000…0 
(2) 符号 位 zo 的 取 值 为 : 当真 值 为 正 数 时 ,zo 为 0; 当真 值 为 负数 时 ,zo 为 1。 
原 人 码 表 示 法 的 优点 是 比较 耳 观 ,简单 易 民 ,但 它 的 最 大 缺点 是 加 法 运算 复 沫 。 这 是 因 
为 , 当 两 数 相 加 时 ,如 果 是 同 写 则 数值 相 加 ; 如 果 是 异 号 , 则 要 进行 减法 。 而 在 进行 减法 运 
算 时 ,还 要 比较 绝对 值 的 大 小 ,然后 减 去 小 数 , 最 后 还 要 给 结果 选择 恰当 的 符号 。 显 然 , 利 用 
原 码 作 加 减法 运算 是 不 太 方 便 的 。 态 外 , 原 码 的 去 是 不 唯一 的 。 


2. 补 码 表示 法 


外人 码 表示 法 是 计算 机 中 实际 采用 的 一 种 编码 方 


该 数 的 符号 , 正 (十 ) 用 0 表示 , 负 ( 一 ) 用 1 表示 ,但 逆 


法 ,与 原 码 表 示 相 同 的 是 其 符号 位 表示 
值 部 分 有 所 不 同 。 
设 纯 小 数 的 补 码 形式 为 + 二 zo. ziz2…z,, 则 补 码 表示 的 定义 为 


1 ] 伍 并 之 (0 
| 之] 二 一 (2.7) 
2 十 X= 二 2 一 |xX| 0 之 工人 一 ] 
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对 于 0, 在 补 三 


表示 情况 下 只 有 一 种 表示 形式 , 即 
[十 0 |# 三 | 一 0 上 让 一 0.000…0 
【 例 2.7】 > 一 十 0. 1001, 则 [xz 一 0. 1001 | 
7 二 一 0.1001, 则 [zx] 二 1.0111。 
对 于 纯 整 数 z+ 二 zxox1x2…xs， 补 人 码 表 示 的 定义 是 


{( 荆 2 人 盖 人 0 
[zj 一 (2. 8) 
十 工 二 ii 一 | 站 | 0 王 工 > 一 2 


补 码 有 两 条 重要 的 性 质 : 
(1) 补 码 的 零 是 唯一 的 。 
(2) 补 码 的 减法 可 以 化 为 加 法 实现 , 即 
[入 十 Yj# 二 LX 十 LY jn 
[ 针 一 Yj 衬 二 LXj# 十 [一 YYj## 
采用 补 码 表示 法 进行 加 减法 运算 比 原 码 更 加 方便 。 因 为 不 论 数 是 正 还 是 负 , 机 可 总 是 
做 加 法 ,减法 运算 可 转换 成 加 法 运算 实现 。 
但 根据 补 码 定义 , 正 数 的 补 码 与 原 码 形式 相同 ,而 求 负数 
法 代 答 减法 , 结 采 还 得 在 求 补 码 时 做 一 次 减法 ,这 显 
法 中 可 以 获得 求人 负数 补 人 码 的 简便 方法 


3. 反 码 表示 法 


反 码 表示 法 中 ,符号 的 表示 法 与 原 码 相同 ; 而 对 于 数值 


(2. 9) 


的 补 人 码 要 减 去 [x]。 为 了 用 加 
然 是 不 方便 的 。 从 下 面 介绍 的 反 码 表示 


分 , 正 数 的 反 码 与 正 数 的 原 码 
的 数值 部 分 则 通过 将 负数 原 码 的 数值 部 分 各 位 取 反 (0 变 1,1 变 0) 


\ 数 的 反 码 形式 为 zx= xzozizz…zs, 则 反 码 表示 的 定义 为 


县 1] 二 工 宇 0 
[zjs = (2.10) 
2 一 2 十 工 一 2 一 | 工 | 0 三 工 二 一 ] 


【 例 2.8】 > 一 十 0. 1001 , 则 [zj 一 0. 1001 1 
z 一 一 0. 1001, 则 [ze 一 1.0110。 
对 于 0, 在 反 人 码 情况 下 有 两 种 表示 形式 , 即 
[十 0 一 0.000…0 
[一 0 一 1.111…] 
对 于 纯 整 数 zx 一 zzlirz…zy 反 公 表 示 的 定义 是 


(二 2 全 了 0 
一 (2.11) 


反 码 与 补 码 的 公式 可 得 到 
[六 了 一 [六 十 2 一 ? 0 二 XxX 宇 一 1 
二 [十 1 上 
这 就 是 通过 反 码 求 补 码 的 重要 会 式 。 这 两 个 公式 告诉 我 们 , 寿 要 将 一 个 负数 用 补 码 表 
示 , 其 方法 是 : 符号 位 置 1 ,数值 部 分 各 位 变 反 , 未 位 加 1 。 
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4. 移 码 表示 法 


移 码 主要 用 于 表示 后 面 要 讲 到 的 笠 点数 的 阶 码 ,而 且 通 稼 表示 的 是 纯 整 数 。 
对 于 纯 整 数 zx 一 zozizz…zy 移 码 表示 的 定义 为 

[二 敬一 2 十 工 re (2 12) 

【 例 2.9】 > 一 十 1001, 则 [zj 总 二 11001 ; 

Z 一 一 1001, 则 | x] 交 二 00111。 
通过 对 比 补 码 和 移 码 发 现 , 对 任意 一 个 贞 值 ,其 补 个 和 移 个 的 机 各 数 表 示 中 , 数 
相同 ,而 符号 恰 愉 相反。 其实, 用 移 人 码 

为 负数 时 ,其 符号 位 为 0。 


2.2.2 定 尽 数 和 浮 扣 数 


日 党 表示 的 数据 类 型 主要 有 两 种 ; 一 是 一 般 的 数据 表示 形式 ,如 125、98.6 等 ; 二 是 科 
学 计数 法 表示 的 数据 形式 ,如 1.25X10 等 。 这 两 种 数据 类 型 对 应 在 计算 机 中 的 表示 形式 
就 是 定点 数 和 浮 点 数 。 


1. 定点 数 的 表示 方法 


作为 一 个 一 般 的 十 进 制 数据 ,在 计算 机 中 除了 要 表示 其 数值 外 ,还 要 表示 其 符号 ( 正 或 
负 ) 和 小 数 点 。 符 号 可 以 使 用 一 位 二 进 制 数 表 示 ,如 "0? 表 示 正 号 “1? 表 示 负 号 。 而 对 于 小 
交点 要 来 取 一 些 特殊 的 人 处理 方法 。 
请 定点 数 是 指数 据 的 小 数 点 位 置 是 固定 不 变 的 。 由 于 定点 数 的 小 数 点 位 置 是 固定 
的 ， ve "就 不 需要 表示 出 来 了 。 在 计算 机 中 ,定点 数 主 要 分 为 两 种 : 一 是 定点 整 
交 数 ; 二 是 定点 小 数 , 即 纯 小 数 。 


值 部 分 
示 的 机 器 数 , 当真 值 为 正 数 时 ,其 符号 位 为 1, 当真 


假设 用 一 个 2 十 1 位 二 进 制 来 表示 一 个 定点 数 工 , 其 
中 一 位 zo 用 来 表示 数 的 符号 位 ,其 余 位 数 代 表 它 的 数 
值 。 这 样 ,对 于 任意 定点 数 xz=zoziz…zo, 其 在 机 岩 中 

定点 数 表 示 如 网 2-1 所 示 。 

如 果 数 xz 表示 的 是 纯 小 数 ,那么 小 数 点 位 于 zo 和 zj 


之 间 ,其 数值 范围 为 
Dl] 2 
如 采 数 xz 表示 的 是 纯 整 数 , 那 么 小 数 点 位 于 最 低位 xz, 的 右边 ,其 数值 范围 为 
0 |zx| 夸 2" 一 1 
在 来 用 定点 数 表示 的 机 右 中 ,对 于 非 纯 整数 或 纯 小 数 的 数据 在 处 理 前 必须 先 通 过 合适 
的 比例 因 了 于 转换 成 相应 的 纯 整 数 或 纯 小 数 ,运算 结果 再 按 比 例 转换 回去 。 目 前 计算 机 中 多 


来 用 定点 纯 整 数 表 示 ,因此 将 定点 数 表示 的 运算 简称 为 整数 运算 。 
2. 浮 扩 数 的 表示 方法 
使 用 定点 纯 整 数 或 纯 小 数 表 示 数 据 ,其 优点 是 表示 方法 


测 单 ,处 理 容 和 多。 但 由 于 在 计算 
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( 称 为 字 长 ) 是 有 限 的 ,因此 定点 数 所 表示 的 数据 范围 也 是 很 有 
无 法 表示 。 例 如 ,使 用 16 位 二 进 制 表示 纯 整 数 ,其 表示 范围 仅 


机 中 表示 数据 的 二 进 制 位 
限 的 ,对 于 一 些 很 大 的 数据 就 
为 : 0 一 16 383( 正 数 )。 为 此 ,人 们 吸取 生活 中 十 进 制 数据 的 科学 计 交 
为 浮上 点 数 的 表示 法 来 表示 更 大 的 效 。 

在 浮 点 数 表示 中 ,数据 被 分 为 两 部 分 : 尾数 和 阶 人 码 。 
示 小 数 点 的 位 置 。 加 上 符号 位 , 浮 点 数据 可 以 表示 为 

一 (一 1)>MR (2. 13) 

其 中 ,M(Mantissa) 是 浮 点 数 的 尾数 ,R(Radix) 是 基数 ,E(E 
点 数 的 符号 位 ,在 计算 机 中 表示 如 图 2-2 所 示 。 


数 表示 数 的 有 效 数 位 , 阶 码 则 表 


图 2-2 浮 点 数 表 示 


在 计算 机 中 ,基数 R 取 2, 是 个 常数 ,在 系统 中 是 约定 的 ,不 需要 表示 出 来 ; 阶 码 玉 用 定 
点 整数 表示 , 它 的 位 数 越 长 , 浮 点 数 所 能 表示 的 数 的 范围 越 大 ; 尾数 M 用 定点 小 数 表示 , 它 


3. 序 点 数 的 IEEE 754 标准 


早期 的 机 帮 很 多 部 支持 浮 点 数 表 示 ,然而 各 目 有 来 用 目 己 定义 的 表示 形式 ,没有 一 个 统一 
的 标准 ,这 给 不 同 机 咒 之 间 程 序 的 移植 带 来 了 一 定 的 困难 。 

1985 年 Intel 打算 为 其 8086 微 处 理 冀 配置 一 种 浮 点 运算 协 处 理 磊 8087FPU 。JIntel 公 
司 请 来 了 加 州 大 学 伯克利 分 校 的 William Kahan 为 其 设计 浮 点 数 格式 , Kahan 又 找 来 了 两 
位 专家 协助 他 ,于 是 就 有 了 KCS 组 合 (Kahn,Coonan and Stone) 。 他 们 共同 完成 了 Intel 的 
浮 点 数 格 式 设计 ,而 且 完 成 得 非常 出 色 , 以 至 于 IEEE 决定 采用 一 个 非常 接近 KCS 的 方案 
作为 IEEE 的 标准 浮 点 格式 ,也 即 IEEE 754 标准 。 目 前 ,几乎 所 有 文 持 浮 点 运算 的 计算 机 
部 米 用 该 标准 ,这 也 为 程序 的 移植 市 来 了 方便 。 

IEEE 754 标准 从 人 逻辑 上 采用 上 述 的 三 元 组 {S,E,M) 表 示 一 个 浮 点 数 N, 如 图 2-3 
所 示 。 

N 的 实际 值 由 下 列 式 子 表 示 : 


n = (— 1)m2° (2.14) 
其 中 sve、m 分 别 为 N、S、E、M 对 应 的 实际 数值 。 
IEEE 754 标准 规定 了 三 种 浮 点 
语言 里 的 float、double 或 者 FORTRAN 里 的 real、double 精度 类 型 。 
单 精 度 浮 点 数 N 共 32 位 ,其 中 S 占 1 位 ,EE 占 8 位 ,M 占 23 位 ,如 图 2-4 所 示 。 


图 2-3 三 元 组 表示 图 2-4 单 精度 浮 点 数 


数 格 式 : 单 精度 , 双 精 度 .扩展 精度 。 前 两 者 正好 对 应 C 
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双 精 度 浮 点 数 N 共 64 位 ,其 中 S 占 1 位 ,EE 占 11 位 ,M 占 52 位 ,如 图 2-5 所 示 。 


b3 62 592 9] 0 


2-5 双 精 度 浮 点 数 


值得 注意 的 是 ,M 虽然 是 23 位 或 者 52 位 ,但 它们 只 是 表示 小 数 点 之 后 的 二 进 制 位 数 ， 
也 就 是 说 ,假定 M 为 “010110011…?”, 在 二 进 制 数值 上 其 实 是 “. 010110011…”。 而 事实 上 ， 
标准 规定 小 数 点 左边 还 有 一 个 隐 合 位 1, 也 就 是 说 区 二 1. M, 这 一 位 并 不 需要 存储 ， 却 可 以 
提高 一 位 尾数 的 精度 。 
插 点 数 而 言 , 它 还 有 一 个 特点 ,就 是 : 一 个 数 的 浮 点 数 表示 可 以 不 是 唯一 的 。 例 如 
十 进 制 数 123 可 以 表示 成 1.1111011X27 .0.11111011X28 .0.011111011X2?* 等 多 种 浮 点 数 
形式 。 为 了 保证 一 个 数 的 浮 点 表示 在 机 器 中 是 唯一 的 ,IEEE 754 标准 规定 : 当 E 的 二 进 制 位 
不 全 为 0, 也 不 全 为 1 时 ,其 尾数 mm 必须 是 上 述 1. M 的 表示 形式 ,这 称 为 浮 点 : 
此 时 e 是 采用 移 码 表示 的 整数 ,e 值 计 算 公 式 如 下 : 
ee 一 下 一 bias， bias 一 2 一】 (2. 15 ) 
其 中 ,bias 为 偶 移 值 ,& 为 正 的 位 数 ,对 单 精 度 浮 点 数 来 说 ,& 王 8, 则 bias 王 127,. 即 e 
FF 一 127; 对 双 精 度 浮 点 数 来 说 ,k 一 11, 则 bias 王 1023, 即 e 一 天 一 1023 。 
当 一 个 浮 点 数 的 尾数 为 0, 不 论 其 阶 码 为 何 值 , 或 者 当 阶 码 的 值 遇 到 比 它 能 表示 的 最 小 
值 还 小 时 ,不 管 其 尾数 为 何 值 ,计算 机 都 把 该 浮 点 数 看 成 零 值 , 称 为 机 器 零 。 
当 阶 码 巨 为 全 0 且 尾 数 M 也 为 全 0 时 ,表示 的 真 值 为 去 ,结合 符号 位 S$ 为 0 或 1, 有 正 
零 和 负 零 之 分 。 当 阶 码 玖 为 全 1 且 尾 数 M 也 为 全 0 时 ,表示 的 真 值 为 无 穷 大 ,结合 符号 位 
S 为 0 或 1, 有 正 无 穷 和 人 负 无 穷 之 分 。 这 样 在 单 精度 浮 点 数 表示 中 ,要 际 去 EF 用 全 0 和 全 1 
表示 零 和 无 穷 大 的 特殊 情况 ,指数 的 偏 移 值 不 选 128 而 选 127。 对 于 规格 化 浮 点 数 ,EFE 的 范 
围 变 为 1 一 254 ,真正 的 指数 值 e 则 为 一 126 一 十 127。 同 样 ,在 双 精 度 位 浮 点 数 表 示 中 ,要 除 
去 下 用 全 0 和 全 1 表示 零 和 无 穷 大 的 特殊 情况 ,指数 的 偏 移 值 不 选 1024 ,而 选 1023。 对 于 
规格 化 浮 点 数 ,FE 的 范围 变 为 1 一 2046 ,真正 的 指数 值 e 则 为 一 1022 一 十 1023 。 
【 例 2. 10】 将 十 进 制 数 43. 6875 转换 成 IEEE 754 标准 的 单 精度 浮 点 数 的 二 进 制 存储 
格式 。 
解 : 将 十 进 制 数 43. 6875 转换 成 二 进 制 数 得 
(43. 6875)io 一 (101011. 1011)， 
再 转换 成 浮 点 表示 形式 ,其 中 尾数 为 1. M 的 形式 
101011. 1011 二 1.010111011X2,， e=5 


于 是 得 到 
S=0， E=5 二 127==132, M==010111011 
最 后 得 到 十 进 制 数 43. 6875 的 单 精度 浮 点 数 的 二 进 制 存储 格式 为 
0 10000100 01011101100000000000000 
【 例 2.11】 硅 浮 点 数 工 的 IEEE 754 标准 存储 格式 为 (41360000)16, 求 其 浮 点 数 的 十 进 
制 值 。 
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解 : 将 (41360000)is 展 开 为 二 进 制 形式 是 
0 10000010 01101100000000000000000 
人 符号 位 S 一 0 
指数 e 一 下 一 127 王 10000010 一 01111111 王 00000011 一 (3),。 
尾数 m=1. M 王 1.01101100000000000000000 王 1.011011 
于 是 有 
T= 1) Xm Xx 2 一 十 1.011011X2 = 1011.01]1 = (11. 375)1 


知识 拓展 
位 、 字 节 、 字 的 概念 

位 ; 又 称 二 进 制 位 (b), 其 英文 单词 为 bit, 是 二 进 制 数 binary digit 的 缩写 。“ 位 ”是 计 
算 机 中 最 小 的 数据 单位 ,每 一 位 的 状态 只 有 两 个 , 即 0 或 1。 

字 节 (B): 英文 单词 为 Byte,1964 年 ,IBM Systemy/360 大 型 机 的 设计 者 建立 了 一 套 以 8 
个 位 为 一 组 作为 计算 机 存储 器 编 址 的 基本 单元 的 约定 ,他 们 称 这 种 8 个 位 的 组 合 为 一 个 字 
节 。 在 机 器 中 ,一 个 字 节 常常 可 以 被 分 为 两 半 , 每 半 4 位 , 称 为 半 字 节 (nibble), 高 4 位 称 为 
高 半 和 学 节 , 低 4 位 称 为 低 半 和 宇宙。1 个 宇 凶 可 以 储存 1 个 英文 字母 或 者 半 个 汉字 , 换 问 话 
说 ,1 个 汉字 占据 2 个 字 节 的 存储 空间 。 现 代 计 算 机 的 编 址 单位 就 是 字 节 ,例如 ,我 们 注意 
到 ,厂家 在 列 出 机 器 的 配置 时 ,其 中 有 一 项 是 机 器 的 内 存 , 往 往 用 多 少 MB 表示 ,这 里 的 BB 
指 的 就 是 Byte 学 市 的 意思 。 

字 : 英文 单词 为 Word, 一 个 字 由 若干 个 相 邻 的 字 节 组 成 , 字 的 位 数 称 为 字 长 。 字 长 通 
常 是 8 的 整数 倍 , 如 16 位 、32 位 ,64 位 等 。 字 长 对 一 人 台 机 器 来 说 具有 特殊 的 意义 , 它 往 往 代 
表 了 该 机 器 进行 数据 处 理 和 运算 的 能 力 。 一 般 来 说 , 若 某 机 器 (主要 指 CPU) 为 64 位 ,一 方 
面 指 该 机 器 CPU 的 数据 总 线 为 64 位 , 另 一 方面 指 该 机 器 CPU 内 部 的 结构 为 64 位 ,这 里 包 
括 其 内 部 的 数据 通路 ,运算 部 件 及 寄存 器 等 。 

另外 ,在 计算 机 中 常常 会 涉及 一 些 计 量 单位 如 下 : 

I 

1M 一 220 

l= 

| 


2.3 非 数 值 数 据 的 机 怖 表示 


韭 数值 数据 主要 是 指 如 字符 ( 串 ) .十进制 数 串 .汉字 图 形 .图 像 等 不 计 其 数值 大 小 的 数 
据 类 型 ,对 这 些 数 据 类 型 ,在 计算 机 中 同样 要 采用 一 定 的 编码 方式 进行 表 不 。 


2.3.1 二 进 制 编码 的 十 进 制 数 


现代 计算 机 除了 能 将 人 们 日 第 生活 中 的 十 进 制 数 苇 换 为 上 述 二 进 制 形式 表示 和 处 理 
外 ,还 能 直接 使 用 二 进 制 编码 的 方式 表示 十 进 制 数 位 ,第 用 的 表示 方法 就 是 二 进 制 编码 的 十 
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进 制 数 (Binary-Coded Decimal) , 商 称 BCD 码 。 

BCD 码 是 将 一 个 十 进 制 数 的 每 个 十 进 制 数字 编码 成 一 个 4 位 的 二 进 制 数 ,并 且 使 用 了 
3 个 4 位 二 进 制 编码 表示 符号 ,其 中 1111 表示 无 符号 数 ,1100 表示 正 数 ,而 1101 则 表示 负 
让 数 的 BCD 编码 方式 如 表 2-2 所 示 。 


表 2-2 BCD 码 编 码 


BCD 编码 十 进 制 数字 BCD 编码 
0 0000 于 0111 

1 0001 8 1000 
2 0010 9 1001 
3 0011 数 
4 0100 
< 

b 


0101 
0110 


从 表 2-2 中 可 以 看 出 ,还 有 6 个 二 进 制 编码 (1010~ 一 1111) 没 有 用 于 数字 编 但 人 
来 几乎 有 40% 的 资源 浪费 ,但 是 在 表示 精度 方面 却 得 到 了 很 大 的 提高 。 例 如 ,十 进 制 数 0. 3 
在 按 2. 2 贡 讲 的 方法 转换 为 二 进 制 时 是 一 个 循环 小 数 0.0100110011001… ,截取 8 位 存储 
则 为 0.01001100 ,如果 再 从 二 进 制 转换 回 十 进 制 却 为 0. 296 875 ,结果 造成 了 一 个 约 1. 05 
的 误差 。 而 大 米 用 BCD 码 表 示 ,十 进 制 数 0.3 可 下 接 存 储 为 11110011( 这 里 假定 数据 格式 
中 隐 含 了 了 小数点 ) ,根本 就 没有 误差 。 

因为 一 个 十 进 制 数字 的 BCD 编码 只 占 一 个 4 位 的 空间 ,所 以 在 存储 一 个 十 进 制 数 串 时 
oder 上 进 制 数 串 形式 表示 ,具体 方法 : 十 进 制 数 串 的 每 个 数字 的 BCD 三 


[ 例 2. 12】 利用 压缩 的 BCD 编码 存储 一 1265 。 

解 : 一 1265 的 BCD 编码 为 

0001 0010 0110 0101 
使 用 三 村 


图 2-6 例 2.12 


2.3.2 了 字 人 和 侍 纺 码 


现代 计算 机 不 仅 要 求 能 处 理 数 人 数据, 还 要 求 能 处 理 非 数值 数据 。 非 数 人 数据 最 篆 上 
的 束 是 字符 信息 ,如 英文 字母 .标点 和 从 号、 十进制 数位 以 及 请 如 $$ 、 如 ,十 等 待 号 和 一 些 控制 


信息 。 在 计算 机 中 对 于 这 一 类 数据 的 表示 ,同样 采用 的 是 二 进 制 编码 的 方法 。 国 际 上 出 现 


本 一 些 不 同 的 编码 方法 ,并 在 不 同 的 领域 或 场合 得 以 应 用 ,以 下 列举 几 种 常见 的 编码 方法 。 
1. EBCDIC 码 


IBM 公司 在 开发 IBM System360 计算 机 之 前 ,使 用 了 一 种 6 位 的 扩展 BCD 码 来 表示 
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字符 和 数字 。 但 是 ,这 种 编码 方式 所 表示 的 字符 很 有 限 ,例如 ,小 写字 符 就 无 法 表示 。 因 此 ， 
IBM System360 系统 的 设计 者 进一步 将 BCD 码 扩 展 为 8 位 ,使 用 了 一 种 扩展 的 二 -十 进 制 
编码 的 交换 码 (Extended Binary Coded Decimal Interchange Code) ,简称 EBCDIC。 表 2-3 
按照 区 位 -数字 的 形式 给 出 了 EBCDIC 代码 。 字 符 表 示 采 用 在 区 位 后 面 添加 数字 位 的 方法 。 
例如 ,字符 a 是 1000 0001, 数 字 3 是 1111 0011。 大 写字 母 和 小 写字 母 的 区 别 仅 仅 在 第 2 位 
不 同 ,只 需 简单 地 进行 1 位 数字 的 翻 位 , 即 可 实现 大 小 写字 母 之 间 的 转换 。 


表 2-3 EBCDIC 编码 


0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111 


0000 NUL SUH SIX 上 IAA PF HI LC DEL RLF SMM VI FEF CK Sk SI 
0001 DLE DC1 DC2 TM RES NL BS I CAN EM CC CUL IFS IGS IRS IUS 
0010 DS US FS BYP LF 上 [TB ESC SM LU2z ENQ ACK BEL 
0011 SYN PN Rs UL 上 QT CU3 DCA NAK SUB 
0100 SP [ 。 达 ( 十 | 
0101 Cr | 基 ) ; n 
0110 / | i GC? 
0111 加 : # RE 


es 
史册 中 
> 已 名 局 
nn 
XmA 
co HM 癌 工 
‘DD NN 网 一 


| 
| 
| 
一 

中 习 口 吕 


2. ADLI|| 


目前 国际 上 普遍 采用 的 字符 系统 是 7 位 的 美国 国家 信息 交换 标准 字符 人 码 (American 
Standard Code for Information Interchang,ASCII 码 )。ASCII 码 是 从 使 用 了 几 十 年 的 电 传 
打字 设备 的 编码 方案 中 直接 衍生 出 来 的 ,这 些 电 传 设备 使 用 19 世纪 80 年 代 发 明 的 5 位 摩 
尔 编 码 。 到 了 20 世纪 60 年 代 , 这 种 5 位 编 色 方式 的 局 限 性 已 经 变 得 非常 明显 ,国际 标准 化 组 
织 (ISO) 就 设计 了 一 种 7 位 的 编码 方案 ,并 于 1967 年 正式 和 \ 布 ， 这 就 是 现在 所 称 的 ASCII 码 。 

ASCI 定义 了 10 个 十 进 制 数 字 .52 个 英文 字母 (大 小 写 )、 32 个 控制 字符 和 32 个 特殊 
符号 (如 中 、 名、 十、 二 每) 等, 共 128 个 元 系 , 万 加 一 位 奇偶 校 验 位 , 共 8 位 表示 一 个 从 号 。 
表 2-4 列 出 了 7 位 的 ASCII 码 字 符 编码 表 。 

ASCII 码 规定 8 个 二 进 制 位 的 最 高 一 位 为 0, 余 下 的 7 位 可 以 给 出 128 个 编码 ,表示 
128 个 不 同 的 字符 。 其 中 95 个 编码 对 应 看 计算 机 终 问 能 襄 人 并且 可 以 显示 的 95 个 字符 ， 
打印 机 设备 也 能 打印 这 95 个 字符 ,包括 大 小 bi 26 个 瑞 文 字母 ,0 一 9 这 10 个 数字 和 从 号、 
通用 的 运算 符 和 标点 符号 十 、 一 、* 、/、 记 ,一 ,二 等 
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MY 
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ES 


b, b, Di Dr 


O0000 
0001 
0010 
0011 
0100 
0101 
0110 
0111 
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UUU0 


NUL 
SOH 
SlAX 
上 工人 
EQOI 


ENQ 


ACK 
DEL 


010 


> 
pd 
jp 


表 2-4 ASCII 字符 编码 表 


一 
ms. 


2 
二 
人 


110 


-一 
| 
jl 


1000 BS CAN ( 
1001 HI 上 ML ) 
1010 LF SUD 其 
1011 VI ESC 十 
1100 FF FS 

1101 CK (rr 了 
1110 SO 上 ~ 
1111 | US / 


OZZrr 人 mR -TATHUONNHA 
NAKAXH 导 2 CINHD Tt 
一 


oO DH 一 -mn Ln 和 Th 


VIA- - 


另外 的 33 个 字符 ,其 编码 值 为 0 一 31 和 127, 则 不 对 应 任何 一 个 可 以 显示 或 打印 的 实 
际 字 符 ,它们 被 用 作 控 制 码 ,控制 计算 机 某 些 外 于 设备 的 工作 特性 和 某 些 计算 机 软件 的 运行 
情况 。 

随 看 计算 机 便 件 性 能 变 得 越 来 越 可 徘 , 对 奇偶 校 验 位 的 需求 开始 减弱 。 在 20 世纪 
80 年 代 , 微 型 计算 机 和 外 围 设备 的 制造 商 开 始 利用 奇偶 校 验 位 来 提供 扩展 的 字符 集 。 

字符 串 是 指 连续 的 一 串 字 符 ,通常 情况 下 ,它们 占用 主 存 中 连续 的 多 个 字 节 ,每 个 字 节 
存储 一 个 字符 。 当 主 存 字 由 2 个 或 4 个 字 节 组 成 时 ,在 同一 个 主 存 字 中 既 可 按 从 低位 字 节 
回 高 位 字 节 的 顺序 存放 字符 串 的 内 容 , 也 可 按 从 高 位 字 节 辐 低 位 字 节 的 顺序 存放 字符 串 的 
内 容 。 这 两 种 存放 方式 都 是 常用 方式 ,不 同 的 计算 机 可 以 选用 其 中 任何 一 种 。 


3. 统一 字符 编码 标准 


无 论 是 EBCDIC 码 还 是 ASCII 码 ,者 是 建立 在 拉丁 霹 系 字母 的 基础 上 的 。 因 此 ,这 些 
编 公 方式 在 对 非 拉 丁字 母 提供 数据 表示 的 能 力 方面 受到 了 很 大 限制 ,而 全 球 大 多 数 人 部 使 
用 非 拉 丁 语 系 。 随 大 全 世界 所 有 国家 都 开 始 使 用 计算 机 ,每 个 国家 部 在 设计 出 一 套 能 够 有 
效 地 表示 日 己 本 国语 言 的 编码 。 然 而 ,这 些 编码 部 不 能 与 其 他 国家 的 编码 相互 莫 容 ,这 样 也 
束 在 融入 全 球 经济 的 遂 路 上 设置 了 为 一 种 障碍 。 

为 了 防止 这 种 情况 继续 恶化 ,1991 年 成 立 了 一 个 由 工业 和 社会 领导 人 组 成 的 协会 ， 
建立 了 一 种 新 的 国际 信息 交换 代码 , 称 为 统一 字符 编码 (Unicode)。 

Unicode 是 一 个 16 位 编码 的 字符 表 , 可 以 同 下 菩 容 ASCII 码 和 拉丁 -1 字符 集 , 并 且 与 
ISO/IEC10646-1 国际 字母 表 相 一 致 。 因 为 Unicode 的 基础 是 16 位 编码 ,所 以 能 够 对 全 世 
界 了 所 使 用 的 每 一 种 语言 的 大 多 数字 和 从 进行 编码 。 如 果 这 16 位 编码 仍 不 够 用 ,Unicode 还 定 
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义 了 一 种 扩展 机 制 ,允许 人 们 对 更 多 的 字符 进行 编码 。 


Unicode 的 编码 空间 由 五 部 分 组 成 ,如 表 2-5 所 示 。 
表 2-5 统一 字符 编码 空间 

字符 类 型 字符 集 说 明 字符 数目 十 六 进 制 数值 
字母 表 拉丁 字母 .希腊 字母 等 8192 0000 一 IFFF 
符号 特殊 符号 .数学 符号 等 4096 2000 一 2FFE 
CK 语音 符号 和 标点 符号 等 4096 3000—3FFF 
Han 统一 的 中 文 .日文 和 韩文 40960 4000 一 DFTFEF 

Han 的 扩展 4096 E000 一 EFFF 
户 定 义 4095 F000—FFFE 


Unicode 有 两 套 标 准 , 一 套 是 UCS-2(Unicode-16), 用 2 个 宇 节 为 字符 编码 :; 男 一 套 是 
UCS-4CUnicode -32) ， ,用 4 个 字 市 为 字符 编码 。 以 目前 常用 的 UCS-2 为 例 , 它 可 以 表示 的 字 
符 数 为 2* 二 65 535 ,基本 上 可 以 容纳 所 有 的 欧美 字符 和 绝 大 部 分 的 亚洲 字符 。 在 Unicode 
里 ,所 有 的 字符 被 一 视 同仁 。 

目前 ,统一 字符 编 公 已 成 为 美式 计算 机 系统 唯一 使 用 的 字符 编码 ,其 他 大 多 数 计 算 机 制 
造 疝 也 痢 在 一 定 程 度 上 支持 统一 字 从 编码 。 


2.3.3 汉字 的 表示 万 法 


普通 的 计算 机 键盘 上 主要 分 布 的 是 0 一 9 数字 键 、A 一 Z 字母 键 和 一 些 功能 键 及 控制 键 
等 。 对 数字 和 字母 等 符号 的 编码 ， 计算 机 采用 的 是 国际 标准 ， ASCII 码 。 从 键盘 输入 的 值 
首先 以 键盘 扫描 人 码 的 形式 被 主机 接收 ,然后 由 操作 系统 中 的 键盘 中 断 处 理 程序 转换 为 相对 
应 的 值 的 ASCII 人 码 。 

但 是 在 键盘 上 无 法 直接 布置 下 成 千 上 万 的 汉字 ,要 让 计算 机 能 对 汉字 进行 处 理 ,必须 解 
决 两 个 问题 ,一 是 汉字 的 编码 问题 ,二 是 汉字 的 输入 问题 。 


1. 汉字 的 输入 万 法 


为 了 能 直接 使 用 普通 标准 键盘 把 汉字 输入 计算 机 ,就 必须 首先 为 汉字 设计 相应 的 输入 
7 法 , 即 一 个 汉字 对 应 的 键盘 上 的 键 的 组 合 。 当 前 采用 的 汉字 输入 编码 方法 主要 有 以 


数字 编码 ; 篆 用 的 是 国标 区 位 码 , 即 用 数字 串 代 表 一 个 汉字 输入 码 。 区 位 码 是 将 国家 
标准 局 公布 的 6763 个 两 级 汉字 分 为 94 个 区 ,每 个 区 分 94 位 ,实际 上 把 汉字 表示 成 二 维 数 
组 ,每 个 汉字 在 数组 中 的 下 标 就 是 区 位 码 。 区 码 和 位 人 码 各 两 位 十 进 制 数字 ,因此 输入 一 个 汉 
字 需 按键 4 次 。 例 如 中? 字 位 于 第 54 区 48 位 ,区 位 码 为 5448。 

数字 编码 输入 的 优点 是 无 重 码 , 且 输 入 码 与 内 部 编码 的 转换 方便 ,缺点 是 代码 难以 
记忆 。 

拼音 码 : 拼音 码 是 以 汉语 拼音 为 基础 的 输入 方法 。 凡 掌握 汉语 拼音 的 人 ,不 需要 训练 
记忆 , 即 可 使 用 。 但 汉字 同音 字 太 多 ,输入 重 码 率 很 高 ,因此 按 拼 音 输入 后 还 必须 进行 同音 
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字 选 择 ,影响 了 输入 速度 。 

字形 编码 : 字形 编码 是 用 汉字 的 形状 来 进行 的 编码 。 汉 字数 虽 多 ,但 部 是 由 一 笔 一 男 
组 成 的 ,而 组 成 汉字 的 部 件 和 笔画 是 有 限 的 。 把 汉字 的 笔 男 部 件 用 字母 或 效 字 进行 编码 , 按 
笔画 的 顺 厅 依次 输入 ,就 能 表示 一 个 汉字 。 例 如 五 笔 学 型 编码 是 最 有 影响 的 一 种 字形 编 公 
方法 ,这 种 编码 方法 重 人 码 率 较 低 ,因此 ,一 旦 学 习 擎 握 , 则 输入 速度 较 快 。 

除了 上 述 三 种 编码 方法 之 外 ,为 了 加 快 输入 速度 ,在 上 述 方法 的 基础 上 又 进一步 发 展 了 
间 组 输入 、 联 想 输入 每 多 种 快速 输入 方法 。 但 它们 部 是 通过 键盘 进行 输入 的 。 今 后 理想 的 
输入 方式 是 利用 语音 或 图 像 识别 扩 术 ,使 计算 机 能 认识 汉字 , 听 私 汉语 ,并 将 其 目 动 转换 为 
机 内 代码 表示 。 目 前 这 种 理想 已 经 成 为 现实 ,只 是 识别 卒 和 识别 速度 有 行 提 局 。 


2. 尺子 编码 


汉字 输入 编码 是 为 方便 人 们 通过 键盘 进行 汉字 的 输入 而 设计 的 编码 ,目前 ,这 种 编码 不 
下 几 干 种 ,也 没有 一 个 统一 的 标准 。 但 无 论 采 用 哪 种 编码 方法 进行 汉字 的 输入 ,在 计算 机 中 
必须 采用 一 种 唯一 的 表示 法 来 存储 和 处 理 汉 字 。 

目前 计算 机 处 理 汉 衬 所 用 的 编码 标准 是 我 国 于 1980 年 颁布 的 国家 标准 GB 2312 一 80， 
即 《 中 华人 民 共 和 国 国 家 标准 信息 交换 汉字 编码 》, 人 简称 国标 码 。 国 标 码 的 主要 用 途 是 作为 
汉字 信息 交换 码 使 用 。GB 2312 一 80 一 共 收 录 了 7445 个 字符 ,包括 6763 个 汉字 和 682 个 
其 他 符号 。 汉 字 区 的 内 码 范 围 高 字 记 从 BO 一 F7, 低 字 布 从 Al 一 FE, 占 用 的 码 位 是 72 藉 
94 一 6768。 其 中 有 5 个 空位 是 D7FA~D7FE。GB 2312 一 80 支持 的 汉字 太 少 ,1995 年 的 汉 
字 扩 展 规范 GBK 1.0 收录 了 21886 个 符号 , 它 分 为 汉字 区 和 图 形 符 叶 区。 汉字 区 包括 
21 003 个 字符 。2000 年 的 GB 18030 是 取代 GBK 1.0 的 正式 国家 标准 。 该 标准 收录 了 
27 484 个 汉字 ,同时 还 收录 了 藏 文 、. 蒙 文 、 维 吾 尔 文 等 主要 的 少数 民族 文字 。 现 在 的 PC 平 
台 必 须 文 持 GB 18030, 对 能 人 式 产 品 暂 不 作 要 求 ,手机 .MP3 一 般 只 文 持 GB 2312 一 80 。 

国标 码 与 ASCII 码 属 同一 制式 ,可 以 认为 它 是 扩展 的 ASCII 码 。 在 7 位 ASCII 码 中 可 
以 表示 128 个 信息 ,其 中 字符 代码 有 94 个。 国标 码 是 以 94 个 字符 代码 为 基础 ,其 中 任何 两 
个 代码 组 成 一 个 汉字 交换 码 , 即 由 两 个 字 节 表示 一 个 汉字 字符 。 第 一 个 字 节 称 为 “区 ”, 第 二 
个 字 下 称 为 "位 >。 这 样 ,该 字符 集 共 有 94 个 区 ,每 个 区 有 94 个 位 ,最 多 可 以 组 成 94 X94 二 
8836 个 汉字 。 

在 国标 码 表 中 , 共 收 录 了 一 、 二 级 汉字 和 图 形 符号 7445 个 。 其 中 图 形 符 号 682 个 ,分 布 
在 1 一 15 区 ; 一 级 汉字 (常用 汉字 )3755 个 , 按 汉 语 拼音 字母 顺序 排列 ,分布 在 16 一 55 区 ; 
二 级 汉字 (不 稍 用 汉字 )3008 个 , 按 偶 劳 部 首 排 列 ,分布 在 56 一 87 区 ; 88 区 以 后 为 空 日 区 ， 
以 每 扩展 。 


3. 汉字 子 模 码 


当 要 将 汉字 在 显示 器 上 显示 或 在 打印 机 上 打印 输出 时 ,是 将 汉字 作为 一 种 图 形 元 素来 
对 待 的 。 因 为 对 于 显示 器 或 打印 机 等 输出 设备 来 说 ,所 有 输出 的 内 容 , 无 论 是 文本 还 是 图 
形 .图 像 ,都 是 通过 点 阵 的 方式 来 形成 的 ,汉字 也 不 例外 。 

对 要 输出 的 汉字 ,计算 机 是 采用 汉字 字模 人 码 来 表示 的 。 汉 字 字 模 码 是 用 点 阵 表示 的 汉 
字 字 形 代 人 码 , 它 是 汉字 的 输出 形式 。 
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+ 


根据 汉字 输出 的 要 求 不 同 , 点 阵 的 多 少 也 不 同 。 简 易 型 汉字 为 16X16 点 阵 , 提 高 型 汉 
字 为 24X24 点 阵 . 32X32 点 阵 , 甚 至 更 高 。 字 模 
点 阵 的 信息 量 很 大 ,所 占 存储 空间 也 很 大 。 以 
16X16 点 阵 为 例 , 每 个 汉字 都 要 占用 32 个 字 节 ， 
国标 两 级 汉字 要 占用 256KB。 因 此 字模 点 阵 只 
能 用 来 构成 汉字 库 ,不 能 用 于 机 内 存储 。 字 库 中 
存储 了 每 个 汉字 的 点 阵 代 码 。 当 显示 输出 或 打 
印 输出 时 才 检 索 字 库 , 输 出 字模 点 阵 , 得 到 字形 。 
图 2-7 表示 出 了 “ 王 ” 字 的 点 阵 及 代码 。 

应 注意 的 是 ,汉字 的 输入 编码 .汉字 编 公 和 
汉字 字模 但 是 计算 机 中 用 于 输入 、 存 储 和 输出 三 
种 不 同 用 途 的 编码 ,不 要 混为一谈 。 


人 | | | | @ | 全 
人 | | | | @ | 
人 | | | | @ | | | ||.®, 
® | | | | ||| ||.®, 
@ | | || | @ | 


2-7 汉字 点 阵 及 编码 


定点 数 的 运算 主要 包括 定点 数 的 加 \ 减 , 乘 、 除 等 运算 。 从 本 节 的 讲述 将 会 看 到 ,二进制 
的 减 , 乘 、 除 等 运算 实际 上 是 通过 加 和 移 位 运算 来 实现 的 。 另 外 ,不 同 运算 的 算法 会 带 来 不 
同 的 运算 及 实现 的 复杂 度 ， 


2.4.1 定点 数 的 加 减 运 算 
在 机 器 中 定点 数 是 以 补 码 形式 表示 的 。 因 此 ,这 里 主要 介绍 补 码 的 加 减 运算 。 
1. 补 码 的 加 法 运算 


根据 补 码 的 性 质 , 可 以 得 出 以 下 结论 : 
(1) 用 补 码 表示 的 两 个 数 相 加 ,其 结果 仍 为 补 码 。 
(2) [六 十 yj 和 一 [六 | 各 十 [ YY | 补 o 
(3) 符号 位 与 数 信 位 一 同 参 加 运算 。 
下 面 以 纯 小 数 的 补 码 加 法 运算 为 例 加 以 说 明 。 
【 例 2. 13】 两 个 相 加 的 数 均 为 正 数 , 设 二 0.1001,y 一 0.0110, 则 有 
[x 二 vy] 宙 二 [0.1001 十 0.0110]# 二 [上 0.1111]# 二 0.1111 
[zi 十 [yi 一 [0.1001] 十 [0.0110]# = 0.1001 二 0.0110 = 0.1111 


上 
LZ 十 yj] 和 二 [zj 补 十 [yj 和 
【 例 2. 14】 两 个 相 加 的 数 一 正 一 负 , 设 zx 一 0. 1001,y 王 一 0.0110, 则 有 
[z+ yla = [0.1001+ (~—0.0110)]a 一 [0.0011]， = 0.0011 
[zj 外 十 上 yj 二 [|0.1001j|# 十 [一 0.0110|# 二 0.1001 十 1.1010 一 0.0011 
同样 
[并 十 y 条 一 | 六] 和 十 [yj 
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【 例 2.15】 两 个 相 加 的 数 均 为 负数 , 设 zx 一 一 0. 1001,y 王 一 0.0110, 则 有 
[7z 十 yi 一 [( 一 0.1001) 十 (一 0.0110)]， = [一 0.1111]， = 1.0001 
[Zz] 宁 十 Ly 二 [一 0.1001 | 杀 十 [一 0.0110|# 二 1.0111 十 1.1010 二 1.0001 
同样 满足 关系 
LZ 十 yj 和 二 [六 j 补 十 Ly 


2. 补 码 的 减法 运算 


根据 补 码 的 性 质 , 还 可 以 得 出 以 下 结论 : 
(1) 用 补 码 表示 的 两 个 数 相 减 , 其 结果 仍 为 补 但 。 
(2) Lz 一 yj 和 一 [Lzj 和 十 [一 yj 补 。 
(3) 符号 位 与 数值 位 一 同 参 加 运算 。 
【 例 2.16】 设 z 王 0. 1001,y 王 0.0110, 则 有 
[rz—yla = [0.1001—0.0110]# 一 [0.00111 一 0.0011 
[zi 十 [一 yi 一 [0.10011 十 [一 0.0110 一 0.1001 十 1.1010 一 0.0011 
从 上 述 结论 (2) 可 以 看 出 ,由 于 补 码 的 减法 运算 可 以 转换 为 加 法 实现 ,所 以 计算 时 可 以 
先 求 出 一 y 的 补 码 ,再 做 加 法 运算 ,这样 在 计算 机 中 实现 时 ,只 需 一 个 加 法 cc 
售 即 可 完成 加 ,减法 运算 ,这 也 是 计算 机 中 使 用 补 人 码 表 示 的 主要 原因 之 一 。 


3. 二 进 制 补 码 加 法 蕴 的 实现 


.上 


补 码 的 二 进 制 加 法 是 通过 逐 位 加 及 进位 实现 的 。 加 法 器 的 基本 电路 
是 实现 一 位 加 的 全 加 器 ,如 图 2-8 所 示 。 全 加 器 的 输入 有 三 个 : 两 个 相 加 
数 x; 、y; 和 一 个 低位 来 的 进位 位 Ci;41; 输出 有 两 个 : 本 位 和 x; 和 向 高 位 的 
进位 位 C;。 输 入 和 输出 之 间 的 逻辑 关系 可 以 通过 表 2-6 表征 。 
表 2-6 全 加 前 真 值 表 
输 入 输 出 


Le 
二 


OO OO ~ oo ol 
一 


DD 


一 ”一 


经 逻辑 设计 化 商 , 可 得 以 下 输入 输出 关系 式 
zi = Xi WD y; WD Ca 
C; = ziyi + (zi yi) Ca 
构成 一 个 多 位 的 加 法 髓 可 以 将 上 述 一 位 的 全 加 器 电路 串联 起 来 ,将 最 低位 的 进位 输入 
端 置 0, 其 余 位 的 进位 输入 端 连接 到 低 一 位 全 加 器 的 进位 输出 端 。 低 位 的 进位 输出 像 波 的 


(2. 16) 
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,或 串 行 进位 加 法 本 。 能 同时 


传播 一 样 传递 到 高 位 ,这样 的 加 法 器 电路 称 为 行 波 进 位 加 法 器 
实现 补 码 加 ,减法 的 加 法 器 ,如 图 2-9 所 示 。 


寄存 器 A 
C+ ] 


re 


[Td 


图 2-9 ” 补 码 运算 加 法 器 


图 2-9 中 ,有 两 个 nn 十 1 位 的 寄存 右 A 和 B, 一 个 nn 十 1 位 的 二 选 一 多 路 开关 MUX 和 7 十 1 
个 全 加 大 。 参 加 运算 的 两 个 相 加 数 事先 分 别 存 放 在 寄存 大 A 和 B 中 ,运算 结 末 存放 在 人 A 中。 

当 进 行 补 码 加 时 “十”“ 一 ”控制 端 为 10, 控 制 选择 寄存 全 也 的 ”17 交 输 出 到 全 加 从 的 

一 个 输入 端 ,实现 zox1… 区 1 加 yoyiyi ya-1ya《( 此 时 C+1 二 0), 即 [zj] 姑 十 Ly jj。 

而 当 进 行 补 码 减 时 , “十”“ 一 ”控制 端 为 01， 内 制 选 先 择 寄 存 器 也 的 "07 端 输出 到 全 加 器 的 一 
个 输入 库 ,实现 rzoz Do-izn 加 yoy yi… yn-1yx 的 有 反 公 并 末 位 加 1( 此 时 C+ 二 1), 即 
[xz | 补 二 站 种 c 

行 波 进 位 加 法 闫 逻辑 关系 清晰 ,电路 实现 和 侧 单 。 但 由 于 其 进位 位 是 由 低 到 高 一 位 一 位 
串 行 生 成 的 ,因此 ,电路 延迟 时 间 长 ,运算 速度 慢 。 一 种 改进 的 方法 是 采用 先行 进位 法 ,具体 
做 法 是 : 将 nn 位 相 加 的 二 进 制 位 进行 分 组 ,每 右 十 位 分 成 一 组 ， a 
成 ,组 间 则 仍然 是 串 行 进位 。 通 过 这 种 多 级 分 组 的 方法 ,可 以 大 大 提高 加 法 融 的 运算 速 


4. 十 进 制 加 法 如 的 实现 


二 进 制 编码 的 十 进 制 数 可 以 直接 运算 。 但 要 注意 的 是 ,其 运算 结果 需要 进行 修正 。 具 
体 修 正规 则 是 : 如 果 两 个 一 位 BCD 码 相 加 之 和 小 于 或 等 于 (1001);, 即 十 进 制 9, 则 不 需要 
修正 ; 如 相 加 之 和 大 于 (1001); , 则 需要 进行 加 6 修正 ,并 回 高 位 进位 。 
【 例 2. 17 了】 2 十 6 一 8 4 十 9 一 13 
0010 0100 
十 0110 十 1001 
1000 1101 
不 需要 修正 十 0110 加 6 修正 
10011 
因此 ,十进制 加 法 器 可 在 二 进 制 加 法 圳 的 基础 上 加 上 适当 的 “校正 ?逻辑 来 实现 ,该 校正 
逻辑 可 将 二 进 制 的 ”和 ?改变 成 所 要 求 的 十 进 制 格式 。 图 2-10 是 实现 一 位 十 进 制 BCD 码 加 
法 的 单元 电路 。 
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MV 


十 进 制 校正 


二 进 制 加 


Ai3 i3 A pia A i NO Pio 


图 2-10 十进制 BCD 码 加 法 单元 电 中 


5. 加 减 运算 的 省 出 判别 


下 面 给 出 两 个 补 码 运算 的 例子 。 

【 例 2.18】〗】 设 z 王 0. 1101,y 王 0.0110, 则 有 

[LZ 十 y 三 [Zi 让 十 L y 三 [0.1101 十 1L0.0110 中 三 0.1101 十 0.0110 王 1.0011 

两 个 正 数 相 加 结果 怎么 变 成 了 负数 ? 

【 例 2. 19】 设 zx 一 一 0.1011,y 一 一 0. 1001, 则 有 

[Lr 十 y 和 补 三 [六 | 补 十 L y 外 三 [一 0. 1011j 补 十 L 一 0. 1001 ji 
一 1.0101 十 1. 0111 二 0. 1100 

两 个 负数 相 加 结果 怎么 变 成 了 正 数 ? 

以 上 两 个 运算 的 结果 肯定 是 错误 的 ,原因 何在 呢 ? 

其 实 ,在 计算 机 中 ,任何 种 类 的 数据 表示 由 于 受到 计算 机 字 长 的 限制 ,其 表示 的 数据 都 是 
有 一 定 施 围 的 。 例 如 ,8 位 二 进 制 补 码 表示 的 纯 整 数 的 范围 是 一 128 一 十 127( 即 10000000 一 
01111111); 16 位 二 进 制 补 码 表示 的 纯 整 数 的 范围 是 一 4096 一 十 4095( 即 1000000000000000 一 
0111111111111111)。 如 果 运 算 结果 超出 了 表示 范围 , 则 称 为 产生 了 洪 出 。 其 中, 告 运 算 结 果 
比 最 大 的 正 数 还 大 , 则 为 正 淤 出 ; 大 运算 结 末 比 最 小 的 负数 还 小 , 则 为 负 洪 出。 

显然 , 当 发 生 淤 出 时 ,其 运算 结果 已 不 正确 了 ,再 继续 后 续 的 运算 已 怠 无 音义。 那么 ， 
机 帮 是 如 何 判 断 是 否 产 生 了 淤 出 呢 ? 下 面 介绍 三 种 洲 出 的 判别 方法 。 

(1) 符号 位 判别 法 。 

从 前 面 的 两 个 例子 可 以 注意 到 : 两 个 正 数 相 加 的 结果 为 负数 ,说 明 产 生 了 溢出 ; 两 个 
负数 相 加 结果 为 正 数 ,也 说 明 产 生 了 洲 出 。 将 这 两 点 归纳 起 来 就 是 :; 当 符 号 相同 的 两 个 数 
外 加 时 ， 如 条 结 果 的 符号 与 相 加 数 的 符 扎 不同 , 则 为 溢出 ,而 一 正 一 负 的 两 个 数 相 加 是 不 会 


对 此 结 才 论 ,可 以 用 逻辑 关系 式 表达 。 设 ze .yo 分 别 为 两 个 相 加 数 的 符号 位 ,xz 为 运算 绪 
果 的 全 号 位 , 则 洲 出 条 件 为 
V 一 Xo Yoo ee zo (2.17) 
若 V 二 1, 则 说 明 产 生 了 溢出 ; 若 V 二 0, 则 无 溢 ! 
如 图 2-11 所 示 是 采用 符号 位 判别 法 进行 这 
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(2) 进位 位 判别 法 。 
再 来 考察 一 下 上 述 两 个 例子 。 对 例 2. 18、 例 2. 19 分 别 列 竖 
式 计 算 如 下 : 
0.1101 1.0101 
+0.0110 +1.0111 
1.0011 0.1100 
无 进位 有 进位 
有 进位 无 进位 图 2-11 符号 位 判别 法 
设 两 相 加 数 的 纺 采 的 符号 位 和 数值 部 分 最 高 位 的 进位 位 分 别 为 Co`Ci。 当 两 个 正 数 相 
加 且 发 生 溢出 时 ,Co 二 1,Ci 二 0, 即 符号 位 产生 了 进位 ,而 数值 部 分 最 高 位 未 产生 进位 ; 当 两 
个 负数 相 加 且 发 生效 出 时 ,Co 一 0,C 一 1, 即 符号 位 末 产 生 进 位 ,而 数值 部 分 最 局 位 广 生 了 
进位 。 将 这 两 点 归纳 起 来 就 是 : 当 两 个 补 码 相 加 时 ,如 果 符 号 位 和 数值 部 分 最 高 位 的 进位 
位 CoC 不 同 , 则 为 溢出 ,相同 则 未 溢出 。 
对 此 结论 ,可 以 用 逻辑 关系 式 表 达 。 设 Cv .Ci 分别 为 结果 的 符号 位 和 数值 部 分 最 高 位 
的 进位 位 , 则 溢出 条 件 为 


X0J020 Xoyn20 


一 C 由 C， (2. 18) 
车 V 二 1, 则 说 明 产 生 了 洪 出 ; 车 V 二 0, 则 无 溢出 。 
如 图 2-12 所 示 是 采用 进位 位 判别 法 进行 溢出 判别 的 逻辑 电路 图 。 
(3) 双人 和 付 号 位 法 ， 


数 。 对 例 2. 18、 例 2. 19 分 别 使 
用 两 位 符号 位 列 竖 式 计算 如 下 .: 
00. 1101 11.0101 
十 00. 0110 十 11.0111 
01. 0011 10. 1100 
可 以 得 出 以 下 结论 : 当 两 个 正 数 相 加 时 ,看 结果 的 两 个 符号 位 相同 , 则 无 洲 出 ; 大 不 
同 , 则 有 洲 出 , 且 为 01 时 是 正 溢出 ,为 10 时 是 负 洲 出 。 
设 运算 结果 的 两 个 符号 位 为 zzo, 则 洲 出 条 件 为 
V = zo 中 > (2. 19 ) 
若 V 二 1, 则 说 明 产 生 了 溢出 ; 知 V=0, 则 无 液 出 。 
图 2-13 是 采用 双 符 号 位 判别 法 进行 溢出 判别 的 逻辑 电路 图 。 


F F 


| 下 
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到 2-12 进位 位 判别 法 图 2-13 双 符 号 位 判别 法 
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用 双 符号 位 的 补 码 又 称 补 码 变形 码 ,其 纯 小 数 定义 为 
[Tl# 二 4 十 工 (mod 4) (2.20) 
区 (mod 2”™™") (2.21) 


2.4.2 定点 数 的 乘法 运算 
1. 原 码 一 位 乘法 


原 码 乘法 是 将 符 扎 位 与 效 人 部 分 分 开 进 行 运算 ,运算 绪 来 的 数值 部 分 是 两 相 乘 交 
值 部 分 之 积 , 而 符号 位 则 是 两 相 乘 数 的 符号 位 的 异 或 。 
设 | x | 原 Tort2""" Tn? 了 | 原 Yo0.JYI2 Van， 则 
[zy lm = (zo PD yo0) | (Crrzez)Cvy y,) (2. 22) 
为 了 在 计算 机 中 实现 原 码 一 位 乘法 , 先 考 察 一 下 手工 完成 二 进 制 乘 的 方法 和 步骤 , 见 
例 2. 20 。 
【 例 2. 20】 > 一 0. 1001,y 王 0. 1101 ,计算 xy。 
解 : 1001 
Xx1101 
1001 位 和 1 
0000 位 积 2 
1001 位 积 3 
1001 位 积 4 
01110101 


即 zy 一 0.01110101。 

手工 计算 时 ,是 将 乘 数 y 从 低 到 高 逐 位 乘 以 被 乘 数 zx ,每 次 得 到 的 位 积 都 相对 上 一 个 位 
积 左 移 一 位 ,最 后 将 所 有 位 积 一 次 性 相 加 , 即 得 乘积 。 

考虑 到 机 器 硬件 的 特点 ,在 计算 机 中 实现 乘法 运算 时 

(1) 人 硬件 实现 时 需要 使 用 三 个 寄存 占 分 别 存放 乘 数 被 乘 数 和 部 分 积 ，。 

(2) 机 玫 中 的 运算 帮 一 般 一 次 只 能 完成 两 个 数 的 相 加 ,手工 一 次 性 相 加 可 以 改 为 逐次 
加 。 即 当 得 到 两 个 位 积 时 ,进行 一 次 相 加 ,得 到 一 个 部 分 积 ; 以 后 每 得 到 一 个 位 积 ,都 将 其 
与 上 次 的 部 分 积 相 加 ,得 到 新 的 部 分 积 ; 最 后 一 次 的 部 分 积 即 为 乘积 。 

(3) 手工 计算 时 ,每 次 得 到 的 位 积 都 相对 上 一 次 位 积 左 移 一 位 ,由 于 最 后 的 乘积 是 乘 数 
或 被 乘 数 的 两 倍 , 因 此 ,加 法 器 的 位 数 也 必须 加 倍 。 通 过 观察 手工 计算 可 以 看 出 ,每 次 部 分 
积 的 最 低位 并 不 参加 运算 。 因 此 ,在 计算 机 实现 时 ,可 以 每 次 将 部 分 积 右 移 一 位 ,部 分 积 的 
最 低位 直送 即 可 。 这 样 的 话 , 加 法 器 的 位 数 与 乘 数 或 被 乘 数 的 位 数 相 同 。 

(4) 部 分 积 右 移 时 ,将 乘 数 寄 人 存 融 同时 右 移 一 位 ,这 样 一 方面 可 以 每 次 根据 乘 数 寄存 大 的 
值 决定 本 次 位 积 的 值 ( 硅 最 低位 为 1, 则 本 次 位 积 为 被 乘 数 ; 奢 最 低位 为 0, 则 本 次 位 积 为 0); 
另 一 方面 , 乘 数 寄存 硕 的 最 高 位 每 次 可 以 接受 部 分 积 右 移出 来 的 一 位 。 

(5) 运算 完成 后 ,部 分 积 寄 存 需 和 乘 数 寄存 闫 中 分 别 存 放 的 是 最 后 乘积 的 高 半 部 和 低 半 部 。 


必须 对 于 工 过 程 进 行 以 下 丧 整 : 
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如 例 2. 21 是 经 过 以 上 调整 后 计算 机 实现 原 码 一 位 乘 的 过 

【 例 2.21】〗】 zx 二 0. 1001,y 王 0. 1101 ,计算 zxy。 

解 : 部 分 积 初 值 为 0, 晶 使 用 双 符 号 位 ,运算 过 程 如 下 : 
部 分 积 


十 之 


右 移 1 位 
十 0 


右 移 1 位 
十 之 


VO 
VO 
UO 
VO 
UU 
UO 
UU0 
VOU 
UO 


UUUU 
1001 
1001 
0100 
UUUU 
0100 
0010 
1001 
1011 


| 二 


| 


右 移 1 位 00 0101 1 0 1 
00 1110 
右 移 1 位 00 0111 


| 一 


即 zy 一 0.01110101 。 
计算 机 中 的 原 码 一 位 乘 可 以 通过 循环 和 迭代 的 方法 实现 ,其 中 每 次 
P,=0 
Pi=(Po zxy,)2 
P,=(P 二 Try,_1)2 


得 到 的 部 分 积 P; 为 


上 计 1 一 (了 ,十 zy iD)2 


P,=(P,_ i 二 Tzxy)2 
也 ,为 乘积 。 
实现 原 码 一 位 乘法 的 逻辑 电路 原理 框图 如 图 2-14 所 示 。 
图 2-14 中 ,RO0、R1,、R2 三 个 寄存 着 分 别人 存放 被 乘 数 .部 分 积 和 乘 效 ,其 中 了 1 的 初 但 为 
0。 当 乘法 开始 时 ,根据 R2 的 最 低位 y, 的 值 决 定 本 次 是 将 RO0 的 内 容 还 是 将 0 与 人 LI( 上 次 
部 分 积 ) 相 加 ,结果 送 回 R1, 然 后 将 R1、R2 联合 右 移 一 位 ,得 到 新 的 部 分 积 。 如 此 重复 7 
步 ,最 后 的 乘积 存在 R1、R2 中 。 


2. 补 码 一 位 乘法 


灼 据 在 计算 机 中 是 以 补 码 的 形 去 存储 的 ,在 用 原 码 实现 乘法 时 ,需要 先 将 补 码 和 苇 换 成 原 


码 , 相 乘 之 后 再 将 原 码 的 绪 打 转换 回 补 三 。 为 了 避免 这 种 转换 ,很 多 计算 机 采用 补 码 直 
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图 2-14 ， 原 码 一 位 乘法 逻辑 电路 原理 框 区 


与 原 码 一 位 乘 不 同 的 是 , 补 码 一 位 乘 的 两 个 乘 数 和 被 乘 数 的 符 扎 位 是 直接 参加 运算 的 。 
下 面 介 绍 一 种 布 斯 乘法 ,该 算法 是 由 布 斯 (Booth) 最 早 提出 的 , 故 以 其 名 字 命 名 。 
设 [Lz 和 一 Zo.TZize…ZnyLyj 和 一 yo.yiyz…yms* 则 有 
Lzy] 补 一 [zj 和 (一 yo 十 0.yiyz…yn) 
一 [Lzj 和 (一 yo 十 2 十 2 十 十 2 77y，) 
= [za[—% 二 Cn 一 2 m+ ys 2 yy) (2™ yy 2 "yy )| 
= [z]# 和 [COm CO— yo) +2 (yO 一 yD) 二 十 2 (Cy, 一 yi) 十 2"*(0—y,)] (2.23) 
根据 式 (2. 23) 可 以 通过 迭 代 公 式 计算 补 人 码 一 位 乘 , 其 中 每 次 得 到 的 部 分 积 P; 为 
[Pol 二 0 
| Pi] 二 人 [Po | 宁 十 Cynni 一 yn)[ x | 入}27 yn+l 二 VU 
LP; 和 一 (人 LP 和 十 (一 yi)Lzj 和 2 


[PP 和 {LP J 二 (Ynite — yx jn -ri 


[| P, | 外 二 [Pi jj 宁 十 Cys CO— vi) Lz 27 
[| xy ji 一 [Pn 和 LP, |# T(t yo ) [LZ | 补 
此 得 到 布 斯 一 位 乘法 的 运算 步骤 如 下 . 

(1) 初始 部 分 积 为 0。 

(2) 根据 乘 数 寄存 右 的 最 低 两 位 决定 : 若 为 00 或 11, 则 将 上 次 部 分 积 直接 右 移 一 位 ; 
右 为 01, 则 将 上 次 部 分 积 加 Lz ,然后 右 移 一 位 ; 在 为 10, 则 将 上 次 部 分 积 加 [一 并 和 ,然后 
右 移 一 位 。 得 到 新 间 

(3) 如 此 重复 2 十 1 步 , 最 后 一 步 不 移 位 。 

【 例 2. 22】 zx 二 0. 1001,y 王 0. 1101 ,计算 [之 y]， 。 

过 程 如 下 。 
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部分 积 乘 数 

00 0000 0. 1 1 0 1 0 末尾 补 0 
十 [一 zj 11 0111 

11 0111 
右 移 1 位 11 1011 1 0 1 1 
十 [xz ja 00 1001 

00 0100 
右 移 1 位 00 0010 0 1 0 1 
十 [一 zj# ll 0111 

11 1001 
右 移 1 位 11 1100 1 0 1 0 
右 移 1 位 11 1110 0 1 0 
十 [x ja 00 1001 

00 0111 
[会 。， 一 00 0111 0 1 0 1 最 后 一 步 不 移 位 

为 了 提 总 乘 法 的 运算 速度 ,计算 机 设计 者 提出 了 各 种 并 行 算 法 ,如 两 位 乘法 .多 位 乘 
阵列 乘法 等 , 谈 者 有 兴趣 可 参阅 相关 资料 。 


2.4.3 定点 数 的 除法 运算 


CE 
pd 


一 一 
> 


i 
Eo 


oY 
pd 


1. 原 码 一 位 除法 


原 码 除法 是 将 符号 位 与 数值 部 分 分 开 进 行 运 算 , 商 的 数值 部 分 是 两 相 除 数 的 数 信 部 分 
相 除 之 后 的 结果 ,而 商 的 符号 位 则 是 两 相 除 数 的 符号 位 的 异 或 。 

层 [Lz 原 一 ZoZlZa… Toy 原 一 yoyiyz…y， 则 

[zy ln = (xo OW yo) | (zz 和) (2. 24) 

为 了 在 计算 机 中 实现 原 码 一 位 除法 , 先 考 察 一 下 手工 完成 二 进 制 除 的 方法 和 步 台 , 如 
例 2. 23 所 示 。 
【 例 2. 23〗】 一 0. 1011,v 一 0. 1101 ,计算 xz/y。 
解 : 


1101 0.1101 
~ 0.01101 
0.010010 
或 者 0.001101 
0.00010100 
0.00001101 
0.00000111 


即 商 为 0. 1101 为 0.00000111。 
手工 进行 二 进 制 除法 的 方法 是 : 判断 余数 (第 一 次 为 被 除数 ) 与 除数 的 大 小 , 告 余 数 小 ， 
则 商 为 0, 并 在 余数 末尾 补 0, 再 用 余数 和 右 移 一 位 的 除数 比较 ,看 余数 大 , 则 商 1, 并 做 减 
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法 ,得 新 余数 。 重 复 上 述 步骤 ,直到 除 尽 或 已 得 到 的 商 的 位 数 满足 精度 要 求 为 止 。 

在 计算 机 中 实现 原 码 一 位 除 需 要 对 手工 过 程 做 以 下 的 改进 ， 

(1) 硬件 实现 时 需要 使 用 三 个 寄存 器 分 别 存放 被 除数 (余数 )、 除数 和 商 。 

(2) 为 使 加 法 器 的 位 数 不 增加 ,可 以 将 手工 中 的 右 移 除数 改 为 左 移 余 数 , 左 移出 去 的 余 
数 的 高 位 都 是 无 用 的 0, 对 运算 不 会 产生 任何 影响 。 

(3) 手工 中 的 商 0 或 1 是 通过 计算 者 用 观察 比较 的 办 法 确定 的 ,而 在 计算 机 中 ,只 能 用 
做 减法 后 判断 结果 的 符号 位 来 确定 。 当 差 为 负 时 , 则 商 为 0, 同时 还 应 把 除数 加 回 到 差 上 
去 ,恢复 余数 为 原来 的 正 值 之 后 再 将 其 左 移 一 位 。 奢 差 为 正 , 则 商 为 1, 并 将 余数 左 移 一 位 。 
这 种 方法 称 为 原 人 码 一 位 除 的 恢复 余数 法 。 

恢复 余数 法 的 缺点 是 : 每 次 当 将 余数 减 去 除数 得 到 的 差 为 负数 时 ,又 要 将 除数 加 回 到 
差 上 去 ,多 增加 了 运算 步骤 。 

对 恢复 余数 法 改进 的 一 种 方法 是 加 减 交 和 蔡 法 ,其 运算 规则 为 : 每 次 将 余数 (第 一 次 为 被 
除数 ) 减 去 除数 , 右 余 数 为 正 , 则 商 为 1, 并 将 余数 左 移 一 位 , 减 除数 ,得 新 余数 ; 石 余数 为 负 ， 
则 商 为 0, 并 将 余数 左 移 一 位 ,加 除数 ,得 新 余数 。 

例 2.24 是 原 码 一 位 除 的 加 减 交 蔡 法 的 运算 过 程 。 

【 例 2.24】〗 zx 一 0. 1011,y 一 0.1101, 计 算 zx/y。 

解 : 商 初 值 为 0, 被 除数 (余数 ) 使 用 双 符 号 位 。 

[yj 二 00.1101， [一 yj] 一 11.0011 
00 1011 0.0 0 0 0 
十 [一 yj 11 0011 


0 ” 差 为 负 , 商 0 
左 移 1 位 11 1100 0 0 0 
十 [yj] 久 00 1101 


| 过 | 一 


差 为 正 , 商 1 


oo 
二 
一 一 
一 
一 
| 一 
Ce 
Ce 
= | 
fp 


左 移 1 位 01 0010 0 0 0 
十 [一 yj 和 11 0011 


二 
已 
,A 
上 一 
OO 
上 一 
oy 
Co 
| 它 
| 一 
| 


] 差 为 正 , 商 1 
左 移 1 位 00 1010 0 0 1 


| -一 


一 一 
— 
一 一 
上 一 
OO 
Co 
Ce 
| 六 

| 一 


0 ” 差 为 负 , 疝 0 


| 一 
| 一 
I | 
OO 


左 黎 ] 位 11 1010 0 


差 为 正 , 商 1] 


Xx/y 的 商 为 0.1101 ,余数 为 0.0111 。 
实现 原 人 码 一 位 除 的 人 逻辑 电路 原理 框图 如 图 2-15 所 示 ，。 
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的 逻辑 电路 原理 框图 
2. 补 码 一 位 除法 


进行 补 码 一 位 除 时 ,被 除数 和 除数 的 符号 位 一 起 参加 运算 。 

相对 原 码 除 来 讲 , 补 码 除 的 运算 规则 更 复杂 。 当 除数 和 被 除数 用 补 码 表示 时 ,判别 是 否 
胸 减 ,要 比较 它们 的 绝对 值 的 大 小 。 因 此 , 奉 两 数 同 符号 ,要 用 减法 ,在 异 叶 , 则 要 用 加 法 。 
对 于 判断 是 否 够 减 , 及 确定 本 次 商 1 或 商 0 的 规则 ,还 与 结果 的 符号 有 关 。 当 商 为 正 时 ， 
的 每 一 位 上 的 值 与 原 码 表示 一 致 ; 而 当 商 为 负 时 , 商 的 各 位 应 是 补 码 形式 的 值 ,一般 先 按 各 
位 的 反 码 值 上 商 , 除 完 后 ,再 用 在 最 低位 上 加 1 的 办 法 求 出 正确 的 补 码 值 。 

在 被 除数 的 绝对 人 小 于 除 效 的 绝对 值 ( 即 商 未 溢出 ) 的 情况 下 , 补 码 一 位 除法 的 运算 规 
则 如 下 : 

(1) 如 条 被 除数 与 除 a ; 耕 两 数 异 号 ,用 被 除数 加 上 除数 。 如 
果 所 得 余数 与 除数 同 号 pe i 则 商 0, 此 即 商 的 符号 位 。 

(2) 求 商 的 数值 部 分 。 如 果 上 次 商 1, 将 余数 左 移 一 位 后 减 去 除数 ; 如 果 上 次 商 0, 将 余 
数 左 移 一 位 后 加 上 余数 。 然 后 判断 本 次 操作 后 的 余数 ,如 果 余 数 与 除数 同 号 , 则 商 1, 和 否则 
商 0。 

(3) 如 此 重复 执行 n 一 1 次 ( 设 数值 部 分 有 位)。 

补 码 一 位 除 的 例子 就 不 再 举 了 。 

以 上 介绍 的 定点 乘 和 和 定点 除法 都 属于 串 行 运算 方法 , 即 通 过 ”加 ( 减 ) 一 移 位 ?操作 来 实 
现 乘除 运算 。 这 些 方法 的 特点 是 算法 徐 单 ,硬件 实现 容易 。 在 本 书 中 介绍 这 些 方法 的 目的 
是 使 读者 能 建立 计算 机 运算 的 设计 思想 ,初步 了 解 机 兹 便 件 是 如 何 实 现 一 定 的 算法 的 。 随 
着 人 们 对 机 响 运 算 速 度 的 不 断 追 求 , 计 算 机 设计 者 提出 了 各 种 并 行 算法 ,以 不 断 提高 机 器 的 
乘除 运算 速度 ,从 而 提高 CPU 的 整体 性 能 。 读 者 有 兴趣 可 参阅 相关 资料 。 


2.5 浮 点 数 的 运算 


同 于 定点 数 的 运算 方法 ,在 溢出 判别 上 也 有 所 不 同 。 


的 加 , 减 和 乘 ,| 了 位 运算 县 有 不 
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2.5.1 浮 点 数 的 加 减 运 算 


N=2*M 
为 浮 点 数 的 尾数 ,一 般 为 纯 小 数 ,在 计算 机 中 通常 采用 补 码 表示 ; 巨 为 阶 码 , 为 纯 整 
数 , 用 补 码 或 移 码 表示 。 浮 点 数 的 运算 实际 上 最 终 转化 为 定点 数 的 运算 来 完成 。 但 由 于 浮 
点 数 表示 的 特殊 性 ,其 运算 又 比 单纯 的 定点 数 运算 更 复杂 。 
浮 点 数 的 加 减 运算 一 般 由 以 下 5 个 步骤 完成 ， 


对 阶 


结果 规格 化 

舍 人 处 理 

溢出 判断 
没 两 浮 点 数 XY 进行 加 减 运算 ,其 中 和 X 一 22M YY 一 22M ，。 
1. 对 阶 


所 谓 对 阶 是 指 将 两 个 进行 运算 的 浮 点 数 的 阶 码 对 齐 的 操作 。 对 阶 的 目的 是 为 使 两 个 

数 的 尾数 能 够 进行 加 减 运算 。 因 为 , 当 进 行 2sM, 与 25M ,加 减 运 算 时 ,只 有 使 两 浮 
点 数 的 指数 值 部 分 相同 ,才能 将 相同 的 指数 值 作为 公 因 数 提 出 来 ,然后 进行 尾数 的 加 减 
运算 。 

对 阶 的 具体 方法 是 ; 首先 求 出 两 浮 点 数 阶 码 的 差 , 即 AE 二 FE, 一 E, ,将 小 阶 码 加 上 AE， 
使 之 与 大 阶 码 相 等 ,同时 将 小 阶 码 对 应 的 浮 点 数 的 尾数 右 移 相应 位 数 , 以 保证 该 浮 点 数 的 值 
不 变 。 几 点 注意 : 

(1) 对 阶 的 原则 是 小 阶 对 大 阶 , 之 所 以 这 样 做 是 因为 奇 大 阶 对 小 阶 , 则 尾数 的 数值 部 2 
的 高 位 需 移出 ,而 小 阶 对 大 阶 移出 的 是 尾数 的 数值 部 分 的 低位 ， 这 样 损失 的 精度 更 小 ， 

(2) 在 AE 二 0, 说 明 两 浮 点 数 的 阶 码 已 经 相同 ,无 须 再 做 对 阶 操 作 了 了 ，。 

(3) 采用 补 码 表示 的 尾数 右 移 时 ,符号 位 保持 不 变 。 

(4) 由 于 尾数 右 移 时 是 将 最 低位 移出 ,会 损失 一 定 的 精度 ,为 减少 误差 ,可 先 保留 大 干 
移出 的 位 , 供 以 后 舍 入 处 理 用 ， 


2. 尾数 运算 


尾数 运算 就 是 完成 对 阶 后 的 尾数 相 加 减 
加 减 运算 。 


。 这 里 采用 的 就 是 前 面 讲 过 的 纯 小 数 的 定点 数 
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3. 结果 规格 化 


在 机 侣 中 ,为 保证 浮 点 数 表示 的 唯一 性 , 浮 点 数 在 机 各 中 部 是 以 规格 化 形式 存储 的 。 对 

于 IEEE 754 标准 的 浮 扣 数 来 说 ,就 是 尾数 必须 是 1. M 的 形式 。 由 于 在 进行 上 述 两 个 定 扣 
\ 数 的 尾数 相 加 减 运算 后 ,尾数 有 可 能 是 非 规 格 化 形 却 ,为 此 必须 进行 规格 化 操作 。 

规格 化 操作 包括 左 规 和 右 规 两 种 情况 。 

左 规 操 作 : 将 尾数 左 移 ,同时 阶 码 减 值 ,和 卫 至 尾数 成 为 1. M 的 形式 。 例 如 , 浮 点 效 
0. 0011 关 到 是非 规格 化 的 形式 , 需 进 行 左 规 操 作 ,将 其 尾 效 左 移 3 位 ,同时 阶 码 减 3, 就 变 成 
1. 1100 关 2 规格 化 形式 了 。 

右 规 操 作 : 将 尾数 右 移 1 位 ,同时 阶 码 增 1 工 , 便 成 为 规格 化 的 形式 了 。 要 注意 的 是 , 右 规 
操作 只 需 将 尾数 右 移 一 位 即 可 ,这 种 情况 出 现在 尾数 的 最 高 位 (小 数 点 前 一 位 ) 运 算 时 出 现 
了 进位 ,使 尾数 成 为 10. xxxx 或 11. xxxx 的 形式 。 例 如 ,10. 0011X 关 右 规 一 位 后 便 成 为 
1. 0001 1 关 关 的 规格 化 形式 了 。 


4. 舍 入 处理 


浮 点 运算 在 对 阶 或 右 规 时 ,尾数 需要 布 移 ,被 右 移 出 去 的 位 会 被 丢 挥 ,从 而 造成 运算 结 
果 精 度 的 损失 。 为 了 减少 这 种 精度 损失 ,可 以 将 一 定位 数 的 移出 位 先 保 留 起 来 , 称 为 保护 
位 ,在 规格 化 后 用 于 伟人 处 理 。 

IEEE 754 标准 列 出 了 4 种 可 选 的 舍 人 处 理 方 法 : 

(1) 束 近 伟人 入 (round to nearest) 。 

这 是 标准 列 出 的 默认 舍 信 方式 ,其 含义 相当 于 日 常 所 说 的 “四 舍 五 人 ”。 例 如 ,对 于 32 
位 单 精度 浮 点 数 来 说 , 若 超出 可 保存 的 23 位 的 多 余 位 大 于 等 于 100…01, 则 多 余 位 的 值 直 
过 了 最 低 可 表示 位 值 的 一 半 , 这 种 情况 下 ,伟人 的 方法 是 在 尾数 的 最 低 有 效 位 上 加 1; 若 多 
余 位 小 于 等 于 011…11, 则 直接 舍 去 ; 若 多 余 位 为 100…00, 此 时 再 判断 尾数 的 最 低 有 效 人 
的 值 , 夺 为 0 则 下 接 侍 去 , 硅 为 1 则 再 加 1。 

2) 阴 十 ce 舍 人 (round toward 十 ce ) 。 

对 正 数 来 说 ,只 要 多 余 位 不 为 全 0, 则 向 尾数 最 低 有 
舍 去 。 

(3) 天 一 ce 售 人 (round toward 一 co ) 。 

与 戎 十 ce 伟人 方法 正好 相反 ,对 正 数 来 说 ,只 是 和 商 单 地 舍 去 ; 对 负数 来 说 ,只 要 多 余 位 
不 为 全 0, 则 加 尾数 最 低 有 效 位 进 1 。 

(4) 瑚 0 爹 人 (round toward 0) 。 

即 宙 单 地 鹤 断 舍 去 ,而 不 管 多 余 位 是 什么 什 。 这 种 方法 实现 和 商 单 ,但 容 旬 形成 聚积 误 
差 , 且 伟人 处 理 后 的 值 总 是 回 下 偶 差 。 


5. 溢出 判断 


以 位 进 1; 对 负数 来 说 , 则 是 简单 地 


定点 数 运算 不 同 的 是 , 浮 点 数 的 溢出 是 以 其 运算 结果 的 阶 码 的 值 是 否 产生 溢出 来 判 
断 的 。 若 阶 码 的 值 超过 了 阶 码 所 能 表示 的 最 大 正 数 , 则 为 上 溢 , 进 一 步 ,车 此 时 浮 点 数 为 正 
数 , 则 为 正 上 洲 , 记 为 十 吕 , 若 学 点 数 为 负数 , 则 为 负 上 洲 , 记 为 一 2; 车 阶 码 的 值 超过 了 阶 
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MV 


,; 则 为 正 下 洲 , 奢 浮 点 数 为 


码 所 能 表示 的 最 小 负数 , 则 为 下 溢 ,进一步 , 若 此 时 浮 点 数 为 了 
负数 , 则 为 负 下 海 。 正 . Pn Wy 0 处 理 . 

要 注意 的 是 , 浮 点 数 的 表 ， 码 表 9 表示 范围 是 有 所 不 同 的 ,定点 数 

4 表示 范围 是 连续 的 ,而 浮 点 数 的 表示 范围 可 能 是 不 连续 的 ,如 图 2 .16 所 示 ， 


取 小 全 数 0 慑 大 负数 


机 器 地 
负 二 证 负 下 次 正 下 次 上 上 湛 


浮 点 数 表示 范围 | 浮 占 站 i 
肾 小 负 奴 取 大 什 效 0 好 小 正 效 最 大 正 数 


和 浮 点 数 表示 范 


图 2-16 定点 站 


【 例 2. 25】 点 数 的 IEEE 754 标准 存储 格式 分 别 为 
0 10000010 01101100000000000000000,y 二 0 10000100 01011101100000000000000 , 求 
zy ,并 给 出 结果 的 IEEE 754 标准 存储 格式 。 
解 : 对 于 浮 点 数 之 


ld 
和 e 一 下 一 127 王 10000010 一 01111111 王 00000011 王 (3))。 


二 和 7 一 ]. AM 一 1.01101100000000000000000 王 1.011011 


于 是 有 
z=(—1)’ XmX2= 十 1. 01101100000000000000000X2: 


符号 位 S 二 0 
wa -E—127 二 10000100 一 01111111 二 00000011 二 (5)w 
尾数 x 一 1. M 王 1.01011101100000000000000=1.010111011 
于 是 有 
y==(—1) xm 
(1) 对 阶 。 
E=E,—E,=3—5=—2 
z=1.01101100000000000000000X2==0.0101101100000000000000000 00X 25 
(2) 尾数 相 加 。 
zy 一 0.0101101100000000000000000 00X2 十 1.01011101100000000000000X 2 
=]1.10111000100000000000000X 25 
二 果 的 IEEE 754 标准 存储 格式 为 0 10000100 10111000100000000000000。 
实现 浮 点 运算 的 加 法 天 逻辑 电路 原理 框图 如 图 2-17 所 示 。 
图 2-17 中 ,三 个 寄存 大 RO、R1 和 R2 分 别 存放 两 个 参加 运算 的 浮 点 数 和 结果 。 第 一 步 
对 阶 , 自 和 完 由 AE 加 法 血 求 出 两 个 浮 点 数 阶 码 的 差 伸 ,然后 由 控制 电路 控制 选择 小 阶 码 浮 点 


Xx2 一 十 1]. 01011101100000000000000X2° 
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数 的 尾数 进入 石 移 寄 存 关 进行 对 阶 时 的 右 移 , 右 移 绪 采 送信 尾数 加 法 着 的 一 个 输入 闯 , 大 阶 
码 浮 点 效 的 尾数 则 直接 送 入 加 法 甫 的 万 一 个 输入 病 。 第 二 步 尾 数 相 加 减 。 第 三 步 规格 化 ， 
由 尾数 加 法 甫 产 生 的 结 采 经 规格 化 部 件 ,一 方面 送 移 位 寄存 沸 进 行 尾 数 移 位 ,万 一 方面 控制 
选择 大 阶 码 进行 阶 码 的 增 或 减 操 作 。 第 四 步 由 舍 人 部 件 对 规格 化 后 的 尾数 进行 舍 人 处 理 ， 
并 将 结 采 送 结 霖 寄存 冀 的 尾数 字段 。 第 五 步 洲 出 处 理 , 由 洲 出 判别 部 件 对 规格 化 后 的 阶 人 码 
进行 淤 出 判别 ,在 未 溢出 , 则 将 续 采 送 结 且 寄存 表 的 阶 码 部 分 。 


座 出 判别 


Cu ye 


设 两 个 浮 点 数 X 一 25 MY 一 25M,，, 则 
XY =(2°:M,)(2°M .,) 
一 2 (MX AM) 
由 此 可 见 , 浮 点 数 乘法 的 基本 规则 是 ; 两 浮 点 数 相 乘 , 乘 积 的 阶 码 是 相 乘 两 数 阶 码 之 
和 ,乘积 的 尾数 是 相 乘 两 数 尾 
同样 


X/Y =(2°:M,)/(2°M,) 
=2%®(M, xX M,) 
一 25f (M, x M,) 
由 此 可 得 浮 点 数 除法 的 基本 规则 是 : 两 浮 点 数 相 除 , 商 的 阶 码 是 相 除 两 数 阶 码 之 差 , 商 
数 是 相 除 两 数 尾 数 之 商 。 简 单 来 说 就 是 : 阶 码 相 减 ,尾数 相 除 。 
的 乘除 运算 比 加 减 运算 少 了 对 阶 这 一 步 , 一 般 由 以 下 5 个 步骤 完成 : 
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阶 码 相 加 / 减 


次 出 判断 


数 的 加 、 减 运算 ,尾数 相 乘 / 除 进行 的 是 定点 小 数 的 
乘 、 除 运算 。 结 果 规 格 化 .伟人 处 理 和 溢出 判断 等 与 前 面 的 浮 点 数 的 加 减 运算 相同 ,此 不 再 


其 中 , 阶 码 相 加 / 减 进行 的 是 定点 束 


袭 述 。 


2.6 数据 校 验 码 


数据 在 计算 机 系统 中 的 生成 处理、 存储 和 传输 过 程 中 都 可 能 会 发 生 错 误 , 例 如 将 数据 
和 仓 和 信和 存储 全 中 产生 的 错误 ,数据 在 数据 通 址 中 传输 时 产生 的 错误 等 。 这 些 错 误 部 属于 便 件 
错误 ,又 称 为 物理 差错 。 虽 然 可 以 通过 提高 便 件 的 可 笔 性 等 手段 减少 和 避免 这 种 错误 ,但 不 
局 ,数据 传输 速度 越 来 越 快 ,这 在 一 定 程 度 上 会 加 大 发 生 数 据 差 错 的 可 能 性 。 

从 物理 差错 的 种 类 上 讲 , 主 要 分 为 随机 错 和 突 发 错 。 随 机 错 是 指 由 于 人 硬件 设备 或 物理 
传输 介质 日 喘 原因 产生 的 差错 ,这 种 错误 是 随机 发 生 的 ,往往 是 一 次 发 生 一 位 或 右 干 位 的 错 
误 。 突 发 错 是 指 由 于 外 界 的 干扰 产生 的 差错 ,这 种 错误 是 突 发 的 ,往往 是 一 次 发 生 大 请 数据 

为 了 解决 这 种 物理 差错 的 问题 ,一 种 第 用 的 方法 十 数 据 编码 , 即 对 要 存储 或 传输 的 数据 
进行 编码 ,使 之 具有 检测 或 纠正 差错 的 能 力 , 这 种 编码 称 为 数据 校 验 码 。 数 据 校 验 码 的 基本 
思想 是 : 在 数据 位 的 基础 上 ,额外 增加 右 干 位 的 元 余 位 (又 称 校 验 位 ) ,使 编码 后 的 数据 符合 
东 种 规律 ,符合 这 种 规律 的 编码 属于 合法 码 , 不 符合 这 种 规律 的 编码 属于 非法 码 , 通 过 检测 
一 个 数据 编码 的 合法 性 ,就 可 以 判断 差 钳 的 发 生 ,进一步 进行 差错 的 定位 ,从 而 纠正 错误 。 
具有 检测 错误 能 力 的 编码 称 为 检 错 人 码 , 具 有 纠正 错误 能 力 的 编码 称 为 纠 错 码 。 第 用 的 数据 
校 验 人 码 包 括 琳 偶 校 验 人 码 \、 海 明 校 验 人 码 和 循环 元 余 公 等 。 


2.6.1 奇偶 校 验 码 


奇偶 校 验 码 是 一 种 最 和 测 单 的 数据 校 验 码 , 是 奇 校 验 码 和 偶 校 验 人 码 的 统称 ,属于 检 错 码 。 
它 的 编码 规则 是 : 在 数据 位 的 基础 上 增加 一 位 元 余 位 ,使 数据 编码 码 的 合法 码 中 1 的 个 数 
恒 为 奇数 或 偶数 。 丰 为 奇效 , 则 为 奇 校 验 码 ; 夺 为 偶数 , 则 为 偶 校 验 人 码 。 例 如 : 

数据 位 : 1001110l->100111011 偶 校 验 码 


数据 位 :10011101 习 100111010 和 奇 校 验 人 码 
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其 中 1.0 为 元 余 位 。 

从 检 纠 错 能 力 上 讲 , 奇 偶 校 验 码 可 以 检测 发 生 奇 娄 
发 生 多 位 错 的 概率 远 比 发 生 一 位 错 的 低 , 所 以 一 般 认 为 奇偶 校 
能 力 ,但 不 能 进行 错误 定位 , 即 不 能 纠正 错误 。 

下 面 以 偶 校 验 为 例 , 对 奇偶 校 验 人 码 的 校 验 方法 和 实现 原理 进行 进一步 讨论 ，。 

设 8 位 数据 位 DD 二 Di1D;D;D4iD;Ds Di; Ds, 则 偶 校 验 编码 为 D1 D;D;D4D;D。D;DsP, 其 
中 偶 校 验 位 


位 错 的 情况 ,但 不 能 纠 错 。 由 于 同时 
验 码 具 有 检测 发 生 一 位 错 的 


P=D.WD,BD,BD,DDDD DVD,DD, 
验 检 测 位 为 
P* =D.@WBD,DBD,BD,DBD;DBD BD,DBD DP 

右 P” 一 0, 则 无 错 ; 大 P* 二 1, 则 有 和 错 。 

【 例 2.26】 设 数 据 位 Di1D;D;DiD;D。D;Ds 一 01001110, 求 其 偶 校 验 编码 。 

解 : P 二 D; 中 D, 中 DBD, BD;DBDDBDDBD: =0B1DIDBIDIOIOIO0O=0 
因此 , 偶 校 验 编码 为 01001110 0。 

奇偶 校 验 码 稼 用 于 计算 机 中 的 内 存 校 验 。 具 体 做 法 是 : 以 字 克 为 单位 进行 编码 , 即 每 8 
位 二 进 制 数据 位 附加 1 位 校 验 位 , 共 9 位 编码 。 每 次 将 9 位 编码 写 入 内 存单 元 中 ， 今后 每 读 
出 的 9 位 数据 奇 为 合法 人 码 , 则 说 明 未 发 生 差 错 , 寿 为 非法 码 , 则 说 明 发 生 了 差错 。 

可 以 通过 如 图 2-18 所 示 的 电路 分 别 实现 偶 校 验 位 的 生成 和 侦 校 验 的 检测 。 


偶 校 


D D， DD DD, D，P， DD, DD, DjD D,D, P 


风 2-18 ” 偶 校 验 位 的 生成 和 偶 校 验 的 检测 
2.6.2 海 明 校 验 码 


海 明 校 验 码 是 由 Richard Hamming 于 1950 年 提出 的 ,属于 纠 错 码 , 它 不 仅 具 有 检 错 能 
力 , 而 且 能 进行 错误 定位 ,从 而 纠正 错误 。 能 进行 错误 定位 意味 着 能 知道 是 哪 位 发 生 了 错 
误 ,对 二 进 制 而 言 ,只 需 将 发 生 错 误 的 位 变 反 即 可 纠正 该 位 的 错误 。 

海 明 校 验 码 的 基本 思想 是 : 对 原 数 据 人 码 按 某 种 规律 分 成 大 十 组 ,每 组 安排 一 个 校 验 位 ， 
进行 奇偶 校 验 ,这 样 就 可 产生 多 位 检 错 信息 ,用 其 不 同 的 二 进 制 组 合 , 指 出 错误 的 所 在 ,从 而 
达到 纠 错 的 能 力 。 这 里 介绍 一 种 具有 纠正 1 位 错 能 力 的 海 明 人 码 的 编码 方法 及 实现 ， 

设 有 效 数 据 位 为 & 位 , 现 设置 校 验 位 为 > 位。 位 二 进 制 共有 2 关 个 不 同 组 合 ( 码 点 ) , 知 
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要 求 这 2 个 不 同 组 合 能 够 分 别 用 于 指出 & 十 ”个 数据 位 和 校 验 位 具体 是 哪 一 位 出 错 , 则 应 满 
足 关 系 : 
2 之 kr 人 Til (2. 25) 
其 中 还 有 一 个 码 点 用 于 指出 “无 错 ”。 
按 式 (2.25), 可 以 得 到 数据 位 与 校 验 位 7 的 对 应 关系 如 表 
表 2-7 数据 位 上 与 校 验 位 r 的 对 应 关系 
数据 位 值 校 验 位 7 值 数据 位 大 值 校 验 位 > 值 
1 2 l2~26 J 
2 一 4 3 57 6 
0 一 1 4 


2-7 所 未 。 


设 m 二 上 十 rr, 即 数据 人 码 和 校 验 人 码 共 mm 位 ,它们 共同 组 成 海 明 码 万 , 互 。;，… 互 , Hi, 则 数 
据 码 和 校 验 码 的 编码 规则 如 下 : 

(1) 位 置 安 排 。 按 以 下 规则 进行 : 每 个 校 验 位 P; 在 海 明 码 中 被 安排 在 位 号 为 2 的 位 
置 ,其 余 各 位 为 效 据 位 , 按 从 低 到 高 逐 位 排列 。 

(2) 编 合 。 海 明码 的 每 一 位 码 瓦 ;( 包 括 数据 位 和 校 验 位 ) 由 多 个 校 验 位 校 验 , 其 关系 是 
被 校 验 的 每 一 位 位 号 要 等 于 校 验 它 的 各 校 验 位 的 位 号 之 和 。 

按 此 原则 ,实际 是 将 海 明 码 校 验 分 成 > 组 的 奇偶 校 验 , 每 个 校 验 位 已 组 成 一 组 奇偶 校 
验 , 按 奇偶 校 验 的 方法 进行 编码 ,因此 , 海 明 校 验 码 又 称 为 分 组 奇偶 校 验 码 。 

下 面 以 一 种 (7,4) 海 明码 为 例 介 绍 海 明码 的 编码 及 检 纠 错 方法 。 

所 谓 (7 ,4) 海 明码 是 指 其 数据 位 4 位 , 校 验 位 3 位 ,数据 编码 共 7 位 。 设 4 位 数据 位 为 
DiD:D: D, 、3 位 校 验 位 为 P1P;P; ,它们 组 成 的 7 位 海 明 码 为 互 ; 互 , 万 ; Hi 昌 ;H; Hl。 根据 
上 述 海 明码 的 编码 规则 ,3 位 校 验 位 Pi 、P; 、P; 分 别 安排 在 2*、2! 和 2 的 位 置 , 即 对 应 Hi 、 
Hs; 和 H ,4 位 数据 位 D .D; 、D: 、D4: 则 对 应 剩 下 的 五: 、 互 ， 5 和 互 ; ,也 即 

H, He Hs Hs H; H; H, = D, D; D; P,D P, P， 
据 此 ,可 以 列 出 海 明 码 位 号 与 校 验 位 位 号 的 关系 如 表 2-8 所 示 ， 


表 2-8” 海 明码 位 号 与 校 验 位 位 号 的 关系 


被 校 验 位 的 海 明 码 位 与 
三 校 验 位 位 写 之 和 


海 明 码 位 与 数据 位 / 校 验 位 参 验 位 位 与 


H; P, 2 2 二 2 

H; DD) 1] ,2 3 二 1 十 2 
H, FP; 4 4 一 4 

H: D; 1 ,4 5 二 1 十 4 
Hs D; 2 4 6 一 2 十 4 
H; D, 1l,2,4 7 一 1 十 2 十 4 
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右 采 用 偶 校 验 , 则 根据 表 2-8, 可 得 出 3 位 校 验 位 P, 、P;、P; 的 侦 校 验 关 系 式 如 下 : 
Pi = Di 中 D, 中 D， 
P, 一 也 | W@W D; 中 也， (2. 26 ) 
P, = 也 ©W D; DD, 
三 个 偶 校 验 式 将 对 应 得 到 三 个 偶 校 验 检 测 位 ,假设 记 为 S1 、S; 和 S; ,它们 的 求解 表达 
式 为 
Si 一 P, 中 Di 中 D, 中 D， 
S$; = P, 中 Di 中 D, 中 D， (2. 27) 
S$; = P; 中 D, 中 D, 中 D， 
这 样 ,根据 S、S 和 S; 的 状态 就 可 以 检测 出 是 否 有 错 , 以 及 确定 错误 的 位 置 ,如 表 2-9 
所 示 。 


第 误 位 置 
万 , 错 
万 ; 错 
H; 错 
有 HH; 错 


S3 I SI 
O00 
001 
010 
011 


例如 ,假设 互 ; 发 生 了 错误 ,其 余 各 位 均 无 错 ,由 于 互 := 王 P , 则 根据 式 (2. 27) ， 
S$=POD 中 D, 中 D, =0 
Ss, = P, DD BD,DD=1 
S$; = P; PDD,DD;PD,=0 
S,S,Si 一 010。 


(7,4) 海 明码 能 够 检测 和 纠正 1 位 错 的 情况 , 却 无 法 检测 和 纠正 多 位 错 的 情况 。 一 些 其 


他 的 海 明 码 则 具有 更 踢 的 检 纠 钳 能 力 。 
(7,4) 海 明码 的 硬件 实现 如 图 2-19 所 示 。 
已 7 饰 Hs 和 乌 厂 ; 蚀 | 玉 销 古人 铺 无 包 
I | La La 


[7 He ls Ha ek eh ef 


111 000 


3-8 详 但 蔡 


区 
偶 校 验 电路 偶 校 验 电 路 ， 


偶 校 验 电路 


H, Hs H; H; H, FH, H, H; H, H; H. FH 


图 2-19 (7,4) 海 明码 的 鲁 件 实现 
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2.6.3 循环 元 余 校 验 码 


循环 元 余 但 (CCyclic Redundancy Check,CRC) 是 一 种 具有 较 强 检 纠 错 能 力 的 校 验 人 码 , 可 
以 对 大 块 数据 进行 校 验 ,主要 应 用 于 主机 与 成 组 数据 交换 的 设备 之 间 的 数据 校 验 。 例 如 , 主 


机 与 磁盘 之 间 的 数据 交换 是 以 块 (又 称 悄 区 ) 为 单位 的 ,一 个 数据 块 的 记录 格式 如 图 2-20 
所 未 。 


数据 (512/1024B) 


图 2-20 主机 与 磁盘 交换 的 数据 块 格式 


这 其 中 的 校 验 字 有 段 通常 采用 的 就 是 CRC 循环 元 余 校 验 码 。 


任何 一 个 二 进 制 序 列 都 可 以 用 一 个 唯一 的 多 项 式 表 示 , 例 如 : 8 位 的 二 进 制 数 
10110010 可 表示 为 x 十 x 十 x 十 xX。 一 般 地 ,一 个 上 位 二 进 制 数 可 唯一 地 表示 为 
Mtr =@ Cr TG oF Gx 十 Go (2, 28) 
M(z) 称 为 该 二 进 制 序列 的 多 项 式 ,C;(i 一 0~~k 一 1) 为 0 或 1， 
CRC 循环 元 余 码 的 编码 和 检测 基于 的 是 这 种 二 进 制 多 项 式 的 模 2 运算。 所谓 模 2 运 
算是 指 以 按 位 模 2 加 为 基础 的 四 则 运算 ,运算 时 不 考虑 进位 和 从 位 。 例 如 : 
模 2 加 模 2 诚 模 2 乘 模 2 除 


10011101 01010011 1 101 101 
+11001010 —10011101 x 1010 1010 万 00010 


01010111 11001110 0000 1010 


0000 0101 
1101 0000 


1110010 1010 
1010 


0 


循环 元 余人 码 的 编 伺 步 桑 如下: 

(1) 设 衣 位 数据 位 的 多 项 式 为 M(x), 将 其 左 移 7 位, 则 得 到 一 个 n= 二 k 十 r 位 的 多 项 式 
M(z)，z' ,其 中 ,前 有 位 为 有 效 的 数据 位 ,而 后 7 位 将 是 要 产生 的 校 验 位 。 

(2) 将 M(x)。，z 除 以 一 个 rr 十 1 位 的 G(x)( 称 为 生成 多 项 式 ) ,得 到 一 个 商 Q(x) 和 一 
个 + 位 的 余数 R(xz), 即 

Mz)，X 一 Q(X)G(zx) 十 R(X) ”( 模 2 运算 ) 

则 RCz) 即 为 M(x) 所 对 应 校 验 位 的 多 项 式 。 

(3) 多 项 式 M(z)，x 十 R(X) 二 T(x) 即 为 发 送 方 得 到 的 n= 二 十 7 位 CRC 校 验 编码 。 

【 例 2.27】 使 用 生成 多 项 式 十 x 十 1 对 4 位 数据 位 1100 进行 CRC 编码 。 
: 数据 位 1100 对 应 的 多 项 式 为 

Mr)=xr rx (k=4) 
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将 1100 左 移 3 位 得 到 的 1100000 对 应 的 多 项 式 为 
M(x)}* Xx =x 二 rx (r=3) 
(M(x) :x )/ G(X) 二 1100000/1011= 二 1110( 商 ) 十 010( 余 数 ) 
M(Cz)。xzs 十 RCz) 一 1100010 
因此 ,4 位 数据 位 1100 对 应 的 CRC 编码 为 1100010。 


2. 循环 元 余 码 的 检测 


下 面 和 考察 一 下 循环 元 余 码 的 检测 。 接 收 方 收 到 的 CRC 校 验 个 对 应 的 多 项 式 为 
T(x) 一 MGz)z TT R(X) 
— Q(TIG(T) TF RT) TR) 
一 Q(x)G(x) ( 模 2 运算 ) 
在 不 出 错 的 情况 下 ,T(z) 可 以 被 GCz) 整 除 ， 
因此 ,循环 元 余 码 的 检测 方法 是 : 将 接收 到 的 校 验 人 码 对 应 的 多 项 式 T(z) 一 MGCz)。 立 十 
R(Cz) 除 以 生成 多 项 式 G(x), 奢 除 尽 , 则 说 明 人 码 字 无 错 ; 奉 除 不 尽 , 则 说 明码 字 有 错 。 
生成 多 项 式 的 选择 对 于 CRC 校 验 码 来 说 非常 关键 , 它 直 接 影 响 到 CRC 码 的 检 纠 错 能 
力 , 人 们 经 过 人 研究 探 对 ,已 找 出 很 多 有 效 的 生成 多 项 式 , 其 中 已 列 为 国际 标准 的 如 
CRC-CCITT: x* 二 Tx“ 十 x 十 1 
CRC-16: x 十 x “十 x 十 1 
a ee he Ee he eh i | 


本 章 小 结 


本 章 主 要 讲述 了 以 下 内 容 : 

(1) 进位 记 数 制 及 数 制 的 转换 。 在 生活 中 使 用 的 是 十 进 制 , 而 在 计算 机 中 使 用 的 是 二 
进 制 表示 数据 , 夯 外 为 了 书 与 方便 ,第 使 用 十 六 进 制 。 任 何 一 个 天 进 制 数 部 可 以 使 用 一 人 1 
唯一 对 应 的 多 项 式 表 示 , 即 (N)r = 二 D,K" 十 D,_i1K”! 十 … 十 DK!i 十 D。K"* 十 D_1,K ! 十 
D_sK 二 D_,K™".。 

) 数 人 逆 据 的 机 党 表 
后 主要 介绍 了 计算 


到 ,而 浮 点 表示 主要 介绍 的 是 IEEE 754 


数值 数据 的 机 器 表示 。 介 绍 了 几 种 常见 的 非 数 值 数据 表示 ,包括 十 进 制 数 串 . 字 
elder 字符 的 表示 除了 最 常用 的 ASCII 码 外 ,还 有 其 他 一 些 编码 方式 ,在 不 同 
场合 有 不 同 的 应 用 。 

(4) 定点 数 和 浮 点 数 的 运算 。 介 绍 了 它们 的 运 
很 大 程度 上 影响 到 硬件 实现 的 效率 。 
5) 数据 校 验 码 。 主 要 讲 了 三 种 校 验 码 : 奇偶 校 验 , 海 明 校 验 和 循环 元 余 码 校 验 。 
存 校 验 常用 奇偶 校 验 ,而 主机 与 磁盘 等 外 设 之 则 的 数据 传输 采用 CRC 校 验 。 


算 方 法 和 硬件 实现 ,不 同 的 运 自 方法 在 


内 
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一 、 名 词 解释 
1. 定点 数 2. 浮 点 妆 3， 阶 码 4. 
5. 规格 化 6， 洲 出 7. 字 节 := 
9. 舍 人 处 理 10. 数据 校 验 码 11. 柯 12. 纠 错 码 
计数 中,( ) 的 去 的 表示 形式 是 唯一 的 。 
A， 原 不 B. 补 码 C. 反 人 码 D. 原 码 和 反 码 
2. 计算 机 系统 中 采用 补 码 表示 及 运算 的 原因 是 ( je 
A. 与 手工 运算 方式 保持 一 致 B. 提高 运算 速度 
C. 简化 计算 机 的 硬件 设计 D. 提高 运算 的 精度 
3. 设 某 机 天 采 用 8 位 补 码 定点 数 表 示 , 其 中 符号 位 1 位 ,数值 位 7 位 , 则 二 进 制 
10000000 表示 的 十 进 制 数 为 ( ) 。 
A. 127 B. 128 C， 一 127 D. 一 128 
4. 某 机 器 字 长 32 位 ,采用 定点 整数 表示 ,符号 位 为 1 位 ,尾数 为 31 位 , 则 可 表示 攻 
正 整 数 和 最 小 负 整 数 分 别 为 人 ) 。 
AAA， 十 (522 一 1) 和 一 (1 一 2 有) Nt IE 
C. 十 (23 一 1) 和 一 (23 一 1) Dh (1) 
5. 在 定点 二 进 制 运算 嚣 中 ,减法 运算 一 般 是 通过 ( ) 来 实现 的 。 
A. 原 码 运 算 的 二 进 制 减法 融 B. 补 码 运 算 的 二 进 制 减法 器 
加 出 加 法 器 D.， 补 码 运 算 的 二 进 制 加 法 需 
6. 在 浮 点 加 减 运算 的 对 阶 中 ,遵循 小 阶 对 大 阶 的 原因 是 ( ) 。 
A. 损失 的 精度 小 B. 损失 的 位 数 
C. 不 容易 产生 洲 D. 都 不 是 
7. 硅 工 二 103,y 一 一 25, 则 下 列表 达 式 米 用 8 位 定点 补 码 运算 实现 时 ,会 发 生 溢出 的 
是 ( ) 。(2014 年 全 国 硕 士 人 研究 生 人 学 统一 考试 计算 机 学 科 专 业 基 础 综合 试题 ) 
A. 工 十 y B， 一 工 十 y C, Xx—Yy D. —zx—Yy 
8. float 型 整数 据 常 用 IEEE 754 单 精度 浮 点 格式 表示 ,假设 两 个 float 型 变量 x 和 yy 分 
别 在 32 位 寄存 器 f 和 人 2 中 , 若 (f) 王 CC900000H,(f2) 王 BOC00000H, 则 过 和 vv 之 间 的 关 
系 为 ( ) 。(2014 年 全 国 硕士 研究 生 入 学 统一 考试 计算 机 学 科 专 业 基 础 综合 试题 ) 
A. XxX 二 y 且 和 从 号 相同 B. x 二 y 且 符 号 不 同 
C. >z 二 yy 且 符 号 相同 D. z 二 vv 且 符 号 不 同 
9. 某 字 长 为 8 位 的 计算 机 中 ,已 知 整 型 变量 z、y 的 机 器 数 分 别 为 [zj 和 王 11110100， 
Ly]# 王 10110000。 若 整 型 变量 > 王 2*Z 二 y/2, 则 > 的 机 器 数 为 ( )。(2013 年 全 国 硕 士 
研究生 人 学 统一 考试 计算 机 学 科 专 业 基 础 综合 试题 ) 
A. 11000000 B. 00100100 
C. 10101010 D. 党 
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10. 用 海 明 码 对 长 度 为 8 位 的 数据 进行 检 / 纠 错时 , 右 能 纠正 一 位 销 。 则 校 验 位 数 至 少 
为 ( ) 。(2013 年 全 国人 硕士 研究 生 入 学 统一 考试 计算 机 学 科 专 业 基础 综合 试题 ) 
A. 2 B. 3 C. 4 D. 5 
腿 定 编译 需 规 定 int 和 short 类 型 长 度 占 32 位 和 16 位 ,执行 下 列 C 语言 语句 


11. 


unsigned short x = 65530; 

unsigned int y = xX; 
得 到 y 的 机 着 数 为 ( )。(2012 年 全 国 硕士 全 究 生 人 和 学 统一 考试 计算 机 和 学科 专业 基础 绽 
合 试题 ) 


A. 0000 7FFA B. 0000 FFFA 
C. FFFF 7FFA D. FFFF FFFA 


三 、 拧 合 圳 
1. 写 出 以 下 不 同 进 制 数据 的 按 权 展开 的 多 项 式 和 形式 。 


(1) (10110101)， (2) (258. 66)10 (3) (D59. 3C)1s (4) (1101. 011)， 
2. 将 以 下 十 进 制 数 分 别 转换 成 二 进 制 数 和 十 六 进 制 数 。 

(1) 38 (2) 128 (3) 0. 125 (4) 250. 5 
3. 将 以 下 二 进 制 数 转换 成 十 进 制 数 。 

(1) 10110101 (2) 11011110 (3) 0. 1101 (4) 1001.0111 
4. 将 以 下 二 进 制 数 转换 成 十 六 进 制 数 。 

(1) 10101001 (2) 1000110 (3) 1101. 0101 (4) 1011100. 11 
5. 将 以 下 十 六 进 制 数 分 别 转换 成 二 进 制 数 和 十 进 制 数 。 

(1) 3AC (2) 0. 12D (3) 258B. CE (4) FFFF 


6. 一 个 围棋 盘 共 有 18 关 18 王 324 个 小 方 格 , 现 假设 在 第 一 个 小 方 格 中 放 入 1 粒 米 ,第 
二 个 小 方 格 中 放 入 2 粒 米 ,第 三 个 小 方 格 中 放 和 人 4 粒 米 ,第 四 个 小 方 格 中 放 人 8 粒 米 ,………， 
如 此 下 去 ,请问 : 
(1) 在 最 后 一 个 小 方 格 中 将 放 人 多 少 粒 米 ? 
(2) 假设 1 两 米 有 1 万 粒 ,那么 最 后 一 个 小 方 格 将 放 和 人 入 多 少 斤 米 ? 
7. 写 出 以 下 二 进 制 数 的 厚 人 码 、 补 码 、 反 人 码 和 移 公 表示 。 
(1) (101101017)， (2) (一 10011011)。 (3) (0.11101111), 
(4) (—0.00110101); (5) (1001.1011), (6) (—0,.00101101); 
8. 浮 点 数 对 阶 的 原则 是 什么 ? 
9. 泽 点 数 加 减 运 算 包 括 哪些 步 又 ? 
浮 点 数 乘 除 运 算 包 括 哪些 步 又? 
， 设 机 如 字 长 为 16 位 , 浮 点 表示 时 , 阶 码 6 位 ,尾数 10 位 :其 中 阶 符 和 数 


件 各 1 位。 


(1) 该 浮 点 数 的 最 大 和 最 小 浮 点 数 分 别 为 多 少 ? 

(2) 奋 采 用 规格 化 表示 , 则 该 浮 点 数 的 表示 范围 是 怎样 ? 

12. 将 十 进 制 数 328. 125 转换 成 IEEE 754 标准 的 单 精度 浮 点 数 的 二 进 制 存 储 格 式 。 

7 浮 点 数 工 的 IEEE 754 标准 存储 格式 为 (A2E80000)16, 求 其 浮 点 数 的 十 进 制 值 。 
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14. 写 出 以 下 十 进 制 数 的 压缩 BCD 人 码 表示 。 
(1) 十 125 (2) 一 328 (3) 十 1234 (4) 一 5678 
15. 求 以 下 zy 的 补 码 的 加 法 和 减法 运算 ,并 判断 结果 是 否 产生 了 洪 出 。 
(1) zx=0.110110,y=0. 110101 (2) zx=0.100101,y=—0. 101101 
(3) z=—0.000011,y=0.101001 (4) z=—0.100101,y=—0.111101 
16. 设 两 浮 点 数 的 IEEE 754 标准 存储 格式 分 别 为 
z=0 10011010 01001101000000000000000,y 王 1 10010100 11011011000000000000000， 
试 作 以 下 计算 ,并 给 出 结果 的 IEEE 754 标准 存储 格式 。 
(1) xiy (2) T—Yy (3) XXy (4) Xx/y 
17. 图 2-21 为 某 ALU 部 件 的 内 部 逻辑 图 ,图 中 S。,、Sj 为 功能 选择 控制 线 ,C;, 为 最 低位 
的 进位 输入 ,A(Ai 一 As) 和 BCB; 一 B4) 是 参与 运算 的 两 个 数 ,FCF 一 F,) 为 输出 结果 。 试 分 
析 在 S。、Si 、Ci, 各 种 组 合 的 条 件 下 ,输出 下 和 输入 A、B、C;, 的 算术 运算 关系 。 


F, F, 已 PF 


As B, A 8B, A, 8B, A! BB 


图 2-21 ALU 部 件 的 内 部 逻辑 图 


18. (2011 年 全 国 硕士 研究 生 人 学 统一 考试 计算 机 学 科 专 业 基 础 综合 试题 ) 
假定 在 一 个 8 位 字 长 的 计算 机 中 运行 如 下 类 C 程序 段 : 

unsigned int X= 134; 

unsigned int vy = 246; 

int m= x; 

int n= vy; 

unsigned int zl = x— Y; 

unsigned int z2 = x+Yy; 

int kl =m— n; 

int k2= m+n; 


右 编 译 肖 编译 时 将 8 个 8 位 寄存 需 有 信 1 一 人 8 分 别 分 配 至 变量 xX、y、m、n、zl1、z2、kl 和 2, 请 
回 从 下列 问题 。 (提示 : 市 符号 整数 用 补 码 表示 。) 
(1) 执行 上 述 程序 段 后 ,寄存 由 R1、R5 和 R6 的 内 容 分别 是 什么 ?〈 用 十 六 进 制 表示 ) 
(3) 上 述 程序 段 涉 及 市 符号 整数 加 / 减 、 无 竺 号 整数 加 / 减 运 自 ,这 四 种 运算 能 否 利用 同 
一 个 加 法 着 及 辅助 电路 实现 ? 简 述 理由 。 
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? 上 述 程序 段 中 ， 


(4) 计算 机 内 部 如 何 判 断 币 符号 整数 加 / 减 运 算 的 结果 是 否 发 生 溢 出 
哪些 市 符号 整数 运算 语句 的 执行 结果 会 发 生 海 出 ? 
19. 试 画 出 一 个 将 4 位 原 码 转换 为 补 码 的 逻辑 电路 图 。 
20. 什么 情况 下 选择 奇偶 校 验 码 ,什么 情况 下 选择 海 明 码 ? 
21. 设 有 16 位 数据 位 ,如 果 采 用 海 明 校 验 , 至 少 需 要 设置 多 少 位 校 验 位 ?数据 位 和 校 
验 位 的 安排 是 怎样 的 ? 
22. 设 有 8 位 数据 位 , 现 采 用 海 明 校 验 码 进行 编码 , 试 说 明 : 
(1) 需要 多 少 位 检验 位 ? 
(2) 对 含有 8 位 数据 位 的 海 明 校 验 码 进行 编码 。 
(3) 如 何 进行 差错 检测 ? 
(4) 画 出 海 明 码 差错 检测 的 人 硬件 实现 图 ， 
23. 使 用 生成 多 项 式 x 十 x 十 1 对 4 位 数据 位 0101 进行 CRC 编码 。 
24. 生成 多 项 式 的 选择 对 于 CRC 校 验 人 码 来 说 非常 关键 , 它 耳 接 影响 到 CRC 人 码 的 检 纠 
错 能 力 ,查阅 资 料 ,进一步 了 解 有 关 生 成 多 项 式 的 性 质 与 检 纠 错 能 力 的 关系 。 
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现代 计算 机 是 按 人 们 预先 编制 的 程序 进行 工作 的 ,而 程序 是 由 指令 组 成 的 。 计 算 机 能 
直接 识别 .执行 的 命令 称 为 机 器 指令 (简称 指令 ), 机 器 指令 用 二 进 制 编码 表示 。 一 条 指令 规 
定 计 算 机 完成 某 种 基本 操作 ,一 台 计 算 机 能 执行 的 所 有 指令 的 集合 称 为 该 计算 机 的 指令 系 
统 ( 或 称 指令 集 )。 

指令 系统 是 计算 机 系统 性 能 的 集中 体现 ,其 功能 与 格式 不 仅 直 接 影 响 到 计算 机 硬件 结 
构 的 设计 ,而 且 与 系统 软件 的 设计 、 计算 机 的 应 用 领域 等 息息相关 。 通 和 常 性 能 较 好 的 计算 机 
都 设置 有 功能 齐全 、 通 用 性 强 、 指 令 丰 富 的 指令 系统 ,而 指令 功能 的 实现 又 需要 复杂 的 硬件 
结构 来 支持 。 

虽然 机 器 指令 能 被 计算 机 直接 识别 和 执行 ,但 是 难于 书写 .记忆 ,出 错 不 把 发 现 ; 汇编 
间 令 是 机 器 指令 的 助 记 符 表 示 形 式 , 与 机 器 指令 是 一 一 对 应 的 。 因 此 ,本 章 主 要 讨论 计算 机 
中 汇编 级 指令 格式 、 地 址 结构 、 指 令 及 操作 数 的 村 址 方式 、 指 令 种 类 和 功能 及 典型 指令 系统 
淮 例 等 ,还 对 精简 指令 集 系 统 作 了 介绍 。 


3.1 汇编 级 机 器 指令 系统 
计算 机 在 汇编 级 机 天 指令 系统 的 设计 上 , 既 要 考虑 指令 系统 功能 的 需要 ,又 要 考虑 实现 
其 所 需 机 器 硬件 的 成 本 。 但 不 管 怎 样 ,对 机 器 的 指令 系统 和 指令 种 类 有 一 些 3 


起 本 的 要 求 。 
3.1.1 指令 系统 的 发 展 


do 入 计 编程 语言 .制造 工艺 技术 都 发 生 了 深刻 的 

。 伴 随 着 这 种 变革 ,计算 机 指令 系统 的 发 展 经 历 了 从 简单 到 复杂 的 演变 过 程 。 

20 世纪 50 一 60 年 代 是 现代 计算 oy 的 早期 ,及 用 电子 管 或 品 体 管 等 分 立 匹 件 组 成 
计算 机 人 硬件 ,其 体积 庞大 ,价格 也 很 昂贵 ,因此 计算 机 的 人 硬件 结构 比较 简单 ,所 支持 的 指令 系 
统 也 只 有 定点 加 减 、 人 逻辑 运算 、 数据 传送 转移 等 上 几 至 几 十 条 最 基本 的 指令 ,而 且 寻 址 方式 
简单 。 

到 了 20 世纪 60 年 代 中 期 ， 计算 机 的 体积 减 小 、 功 耗 下 降 、 价 格 不 
断 下 隆 ,硬件 功能 不 断 增 强 ,指令 系统 也 越 来 越 丰富 ， 除 最 基本 的 指令 外 ,增加 了 乘除 运算 、 
浮 点 运算 .十进制 运算 、 人 中 外 再 等 撕 人 指令 数 | 目 有 一 二 百 条 , 寻 址 方式 也 趋 于 多 样 化 ， 

随 着 集成 电路 的 发 展 和 计算 机 应 用 领域 的 不 断 扩 大 ,20 世纪 60 年 代 后 期 开始 出 现 系 
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列 计算 机 。 系 列 计 算 机 是 指 基 本 指令 系统 相同 、 基 本 体系 结构 相同 的 一 系列 计算 机 ,例如 
Pentium 系列 微型 计算 机 。 一 个 系列 往往 有 多 种 型 与 ,但 由 于 推出 的 时 间 不 同 , 订 用 的 冀 件 
不 同 ,它们 在 结构 和 性 能 上 有 所 差异 。 通常 是 新 推出 机 种 的 指令 系统 一 定 包含 所 有 旧 机 种 
的 全 部 指令 , 旧 机 种 上 运行 的 各 种 软件 可 以 不 加 任何 修改 便 可 在 新 机 种 上 运行 ,大 大 减少 了 
软件 开发 费用 。 系 列 计算 机 不 仅 较 好 地 解决 了 各 机 种 的 软件 莱 容 问题 ,而 且 新 机 种 的 性 能 
价格 比 优 于 旧 机 种 。 

20 世纪 70 年 代 , 高 级 语言 已 成 为 大 .中 、 小 型 机 的 主要 程序 设计 语言 ,计算 机 应 用 日 益 
普及 。 但 是 复杂 的 软件 系统 设计 一 直 没 有 很 好 的 理论 指导 ,导致 软件 质量 无 法 保证 ,从 而 出 
现 了 所 谓 的 “软件 扼 机 >。 人 们 认为 , 顷 小 机 汕 指 令 系 统 与 高 级 声言 场 义 的 差距 ,为 局 级 声言 
提供 更 多 的 支持 ,是 缓解 软件 危机 有 效 和 可 行 的 办 法 。 计 算 机 设计 者 们 利用 当时 已 经 成 熟 
的 微 程 序 技术 和 飞速 发 展 的 超大 规模 集成 电路 (VLSI) 技 术 ,增设 多 种 复杂 的 、 面 癌 高 级 场 
言 的 指令 ,使 指令 系统 越 来 越 复 林 化 ,大 多 数 计算 机 的 指令 系统 多 达 几 百 条 ,由 此 就 出 现 了 
复杂 指令 系统 计算 机 (Complex Set Instruction Computer,CISC)。 

CISC 指令 系统 的 主要 特点 是 : 指令 格式 多 、 寻 址 方式 复杂 .指令 数量 多 ,不同 指令 的 使 
用 频率 相差 很 悬 珠 。 大 量 的 统计 数字 和 表明, 大约 有 20 如 的 指令 使 用 频率 比较 高 ,占用 了 
80% 的 处 理 机 时 间 。 换 句 话 说, 占 指 令 系 统 80% 的 指令 只 在 20% 的 处 理 机 运行 时 间 内 才 被 
用 到 。 

由 于 CISC 庞大 的 指令 系统 不 但 使 计算 机 的 人 研制 周期 变 长 ,正确 性 难以 保证 ,不 多 调试 
和 维护 ,而且 由 于 采用 了 大 量 使 用 频率 低 的 指令 而 造成 硬件 催 源 当 费 。 计 算 机 设计 者 符 试 
从 为 一 条 途径 来 文 持 局 级 语言 及 适应 VLSI 技术 特点 。1975 年 IBM 公司 John Cocke 提出 
了 精简 指令 系统 计算 机 (Reduced Instruction Set Computers, RISC) 的 设想 。 有 关 RISC 的 
内 容 将 在 后 续 的 3.4 节 详 细 介绍 。 

20 世纪 80 年 代 后 期 以 来 ,RISC 微 处 理 帮 了 迅速 发 展 ,广泛 采用 了 超标 量 和 超 流 水 线 等 
指令 级 并 行 处 理 技术 。 但 是 人 们 又 发 现 RISC 指令 系统 并 不 能 充分 实现 指令 级 并 行 处 理 ， 
从 而 影响 了 计算 机 性 能 的 进一步 提高 。1983 年 ,美国 J，Fisher 教授 提出 了 超 长 指令 字 
(VLIW) 体 系 结 构 。VLIW 指令 系统 的 设计 思想 是 增强 指令 的 并 行 性 ,机 器 指令 字 具 有 固 
定 的 格式 (一 种 或 者 多 种 ) ,每 条 指令 中 包含 多 个 独立 的 字段 ,字段 中 的 操作 人 码 被 送 往 不 同 的 
功能 部 件 。 这 是 受 微 程序 设计 技术 中 水 平 型 微 指令 的 启示 。 

总 之 ,计算 机 指令 系统 的 发 展 经 历 了 从 重音 到 复 洒 ,然后 又 从 复 洒 到 简单 的 演变 过 程 。 


3.1.2 指令 系统 性 能 的 要 求 


指令 系统 的 性 能 决定 了 计算 机 的 基本 功能 , 它 的 设计 直接 关系 到 计算 机 的 硬件 结构 和 
用 户 的 需要 。 由 于 计算 机 性 能 、 体 系 结构 以 及 使 用 环境 等 要 求 不 同 ,指令 系统 间 的 差异 也 是 
很 大 的 。 同 时 , 随 着 计算 机 技术 的 迅速 发 展 , 对 计算 机 性 能 要 求 越 来 越 高 ,硬件 价格 迅速 下 
降 ,指令 系统 也 趋向 强 功 能 高效. 复杂 化 。 因 此 ,试图 给 计算 机 指令 系统 确定 一 个 统一 的 衔 
量 标准 是 很 困难 的 。 一 般 情况 下 ,指令 系统 应 满足 完备 性 .有 效 性 .规整 性 和 兼容 性 。 


1. 指令 系统 的 完备 性 
千 性 是 指 在 一 个 有 限 可 用 的 存储 空间 ,对 于 任何 可 解 的 问题 ,编写 计算 和 
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系统 所 提供 的 指令 足够 使 用 。 一 般 来 说 ,为 使 程序 高 效 运 行 和 便于 便 件 实现 ,一 人 
令 系 统 应 包括 传送 类 指令 、 算术 运算 类 指令 .逻辑 运算 类 指令 .程序 控制 类 指令 .字符 串 指 
令 .特权 指令 和 调试 指令 。 硅 米 用 统一 编 址 , 则 用 传送 指令 即 可 实现 输入 输出 的 目的 ; 大米 
用 单独 编 址 , 则 需要 专门 的 输入 输出 指令 。 

以 上 几 种 类 型 指令 并 不 是 互相 独立 的 ,在 一 定 条 件 下 可 以 互相 者 


2. 指令 系统 的 有 效 性 


有 效 性 是 指使 用 该 指令 系统 的 指令 编制 程序 能 高 效率 地 运行 。 这 个 高 效率 表现 在 解 题 
速度 快 .占用 存储 空间 小 。 有 效 性 是 针对 整个 指令 系统 而 言 的 ,这 是 一 个 很 复杂 的 问题 ,很 
难 确定 一 个 统一 标准 。 有 效 性 反映 了 指令 的 功能 要 求 ,也 反映 了 指令 系统 的 完备 性 要 求 。 
一 个 更 完备 的 指令 系统 就 会 有 更 好 的 有 效 性 ,如 指令 系统 中 有 多 种 移 位 指令 和 字符 串 处 理 
指令 ,对 于 数据 处 理 就 会 有 较 高 的 有 效 性 。 在 新 一 代 计 算 机 指令 系统 中 有 专门 的 编辑 指令 
其 至 某 些 常用 的 高 级 语言 的 语句 也 用 一 条 指令 来 实现 等 ， 采取 这 些 措施 无 疑 将 大 大 提高 指 


vi 


3. 指令 系统 的 规整 性 


规整 性 细 分 为 指令 操作 的 对 称 性 和 匀 齐 性 ,指令 格式 与 数据 格式 的 一 致 性 。 

指 全 译作 门 届 各 全 下 捐 站 十 汪 半 ， 所 有 寄存 顺 ( 存 储 ) 单 元 都 可 以 同等 对 符 ,不论 哪 一 个 

或 运算 结果 都 可 以 不 受 约束 地 存 入 任 一 单元 。 如 传送 指令 , 既 有 A<-B, 也 有 B<-A; 
加 法 指令 既 有 A< AT 十 B, 也 有 B< AT+B 等 。 这 种 操作 的 对 称 性 对 于 提高 软件 效率 和 使 用 
方便 是 很 有 利 的 ,但 是 ,目前 许多 机 器 还 不 能 很 好 地 实现 这 一 对 称 性 。VAX-11 机 的 指令 系 
| 令 操 作 具 有 较 好 的 对 称 性 。 

令 操 作 的 匀 齐 性 是 指 一 种 性 质 的 操作 可 适用 于 各 种 数据 类 型 。 如 VAX-11 机 在 数 

训 他 这 站 据 交 换 、 数 据 测 试 和 计算 等 操作 时 ,可 以 勾 齐 地 适用 于 三 种 整数 数据 类 型 ( 字 节 、 
字 和 双 字 ) 和 两 种 浮 点 数据 类 型 ( 短 浮 点 和 长 浮 点 ) 中 的 每 一 种 。 指 令 操 作 的 匀 齐 性 可 使 汇 
编程 序 设计 与 编译 程序 无 须 依 赖 数据 类 型 去 选用 指令 ,缩短 了 程序 代码 长 度 , 加 快 了 程序 忆 
行 速 度 。 匀 齐 性 在 以 前 的 一 些 机 大 中 没有 很 好 地 实现 。 如 IBM 370 机 有 字 (32 位 ) 加 法 ,也 
有 半 字 (16 位 ) 加 法 ; 但 只 有 字 除 法 , 却 没 有 半 字 除法 等 。 随 看 便 件 价格 进一步 下 降 ,指令 
操作 的 匀 齐 性 有 了 很 大 的 改善 。 

指令 格式 与 数据 格式 的 一 致 性 是 指令 字 长 与 数据 字 长 有 一 个 规整 的 关系 ,便于 程序 的 
加 工 处 理 。 如 机 间 基 本 字 长 为 32 位 ,长 指令 选 32 位 , 短 指 令 选 16 位 ,在 此 字 长 的 条 件 下 ， 
可 以 选择 指令 的 地 址 格式 。 


4. 指令 系统 的 兼容 性 


从 计算 机 的 发 展 过 程 已 经 看 到 ,由 于 组 成 计算 机 的 基本 人 硬件 发 展 迅速 ,计算 机 的 更 新 换 
代 是 很 快 的 ,这 束 存 在 软件 如 何 跟 上 的 问题 。 大 家 知道 ,一 合 新 机 毅 推 出 交付 使 用 时 , 仅 有 
少量 软件 可 提交 用 户 ,大 量 软件 是 不 断 充 实 的 ,尤其 是 应 用 软件 ,有 相当 一 部 分 是 用 户 在 使 
用 机 甫 过 程 中 不 断 产 生 的 ,这 就 是 所 谓 的 第 三 方 提供 的 软件 。 为 了 缓解 新 机 化 的 推出 与 原 


有 应 用 软件 能 否 继 续 使 用 之 间 的 矛盾 ,1964 年 [BM 公司 在 设计 IBM 360 计算 机 中 所 采用 
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的 系列 机 思想 较 好 地 解决 了 这 一 问题 。 从 此 以 后 ,计算 机 公司 生产 的 同一 系列 计算 机 尽管 
其 人 硬件 实现 各 不 相同 ,但 在 指令 系统 、 数据 格式 .IO 系统 等 体 持 相同 ,因而 软件 完全 兼容 
(在 此 基础 上 ,产生 了 茹 容 机 )。 当 人 研制 该 系列 计算 机 的 新 型 号 或 高 档 产 品 时 ,尽管 指令 系统 
可 以 有 较 大 的 扩充 ,但 仍 保留 原来 的 全 部 指令 ,保持 软件 “向 上 兼容 ”的 特点 

系列 机 的 各 型 号 机 各 由 于 推出 的 时 间 不 同 ， 在 结构 和 性 能 上 有 差异 ,做 到 所 有 软件 都 完 
全 菩 容 是 不 可 能 的 ,只 能 做 到 “同上 兼容 ”或 “ 癌 前 非 容 ”, 即 低档 机 运行 的 软件 可 以 在 高 档 机 
运行 。 

指令 系统 的 菲 容 性 使 得 大 量 已 有 软件 产品 得 到 继承 ,保护 了 用 户 的 前 期 软件 投资 ,减少 
了 软件 的 开发 费用 ,同时 ,新 型 号 机 帮 一 出 现 就 具有 让 晤 的 软件 ,有 利于 打开 市 场 销 路 。 


3.1.3 指令 操作 的 种 类 


不 同类 型 的 计算 机 所 具有 的 指令 类 型 是 多 种 多 样 的 ,其 指令 的 数量 与 功能 、 指 令 格式 、 
寻 址 方式 、 数 据 格 式 都 有 差别 ,即使 是 一 些 常用 的 基本 指令 ,如 算术 运算 指令 .逻辑 运算 指 
令 .转移 指令 等 也 是 各 不 相同 的 。 但 是 从 指令 的 操作 功能 来 考虑 ,一 个 较 完善 的 指令 系统 应 
当 包 括 数据 传送 类 指令 ,算术 运算 类 指令 ,逻辑 运算 类 指令 .程序 控制 类 指令 ,输入 输出 类 指 
令 、 系 统 控制 类 指令 等 。 

1. 数据 传送 类 指令 

计算 机 的 操作 大 部 分 可 以 归结 为 各 类 信息 的 传送 ,因此 数据 传送 类 指令 是 最 基本 的 指 
令 。 数据 传送 指令 主要 用 于 寄存 器 与 寄存 器 寄存 器 与 存储 单元 .存储 单元 与 存储 单元 之 间 
的 数据 传送 操作 。 对 存储 器 来 说 ,数据 传送 包括 对 数据 的 读 、 写 操作 。 数 据 传送 时 ,数据 从 
源 地 址 传送 到 目的 地 址 ,而 源 地 址 中 的 内 容 保持 不 变 。 因 此 ,计算 机 中 的 数据 传送 实际 上 是 


数据 传送 类 指令 可 以 是 一 个 操作 数 的 传送 ,也 可 以 是 一 串 操 作 数 的 传送 ,这 取决 于 指令 
的 操作 要 求 。 例 如 ,Intel 80x86 的 MOVS 指令 一 次 可 以 传送 一 个 字 节 或 字 ,而 加 上 重复 执 
行 前 级 (REP) 后 ,一 次 可 以 把 一 批 数 据 从 存储 器 的 一 个 区 域 传送 到 男 一 个 区 域 。 

数据 传送 指令 既 可 以 是 单 向 的 ,也 可 以 是 双向 的 ,即将 源 操 作 数 与 目的 操作 数 ( 一 个 字 
节 或 一 个 字 ) 相 互 交 换 位 置 。 例 如 Intel 80x86 中 的 XCHG 指令 , 源 操 作 数 与 目的 操作 数 可 
互 换 位 置 , 源 操 作 数 可 以 在 寄存 器 或 主 存单 元 中 ,目的 操作 数 则 只 人 允许 在 通用 寄存 器 中 。 


2. 算术 运算 类 指令 


算术 运算 类 指令 主要 用 于 定点 和 浮 点 运算 。 这 类 运算 包括 定点 加 、 减 、 乘 , 除 运 算 , 浮 点 
加 \、 减 .乘除 运算 ,以 及 日 加 1 、 上 月 减 1 .比较 等 ,有 些 机 闪 还 有 十 进 制 运 算 指 令 。 绝 大 多 数 算 
术 运 算 指 令 都 会 影响 到 状态 标志 人 位。 通常 的 标志 位 有 进位 .溢出 、 全 零 、 正 负 和 奇偶 等 。 

比较 指令 是 减法 指令 的 一 个 特殊 变化 , 仍 是 进行 两 数 相 减 的 运算 ,但 结果 不 回 送 , 即 不 
保留 “ 差 ”。 比 较 指 令 的 功能 在 于 不 破坏 原来 的 两 个 操作 数 , 而 仅 设置 相应 的 标志 位 ,为 紧 跟 
在 其 后 的 条 件 转 移 指令 提供 操作 的 依据 ,以 决定 程序 的 走向 。 

为 了 实现 高 精度 的 加 / 减 运算 ( 双 信 字 长 或 多 字 长 ) ,低位 字 ( 字 节 ) 加 法 运算 所 产生 的 进 
位 (或 减法 运算 所 产生 的 依 位 ) 都 存放 在 进位 标志 中 ; 在 高 位 学 (学 节 ) 加 / 减 运 算 时 ,应 考虑 
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低位 字 ( 字 布 ) 的 进位 (或 依 位 )。 因 此 指令 系统 中 除去 普通 的 加 、 减 指令 外 ,一 般 都 设置 市 进 
位 加 指令 和 夷 依 位 减 指 令 ,例如 Intel 80x86 中 的 ADC、SBB 指令 


3. 逻辑 运算 类 指令 


一 般 计 算 机 都 具有 逻辑 与 或. 非 . 异 或 、 移 位 等 指令 ,这 类 指令 主要 用 于 无 符号 狐 
操作 .代码 转换 .判断 及 运算 。 例 如 Intel 80x86 中 的 AND.OR NOT XOR 等 指 令 

移 位 指令 用 来 对 操作 数 实 现 左 移 . 右 移 和 循环 移 位 操作 。 移 位 指令 可 分 为 算术 移 位 、 逮 
辑 移 位 和 循环 移 位 三 类 ,同时 它们 又 分 别 包 括 左 移 和 右 移 两 种 。 例 如 Intel 80x86 中 的 
SHL/SHR、SAL/SAR.、ROL/ROR.、RCL/RCR 指令 。 


的 位 


4. 程序 控制 类 指令 


程序 控制 类 指令 主要 用 于 控制 程序 的 执行 顺序 ,并 使 程序 具有 测试 .分 析 与 判断 的 能 
力 , 因 此 , 它 是 指令 系统 中 的 一 个 重要 组 成 部 分 。 这 类 指令 主要 包括 转移 指令 、 转 子 程序 与 
返回 指令 ,程序 中 断 指 令 等 。 

1) 无 条 件 转移 指令 

无 条 件 转移 指令 执行 时 ,用 来 改变 指令 的 正常 执行 顺序 ,不 受 任何 约束 地 将 程序 转移 到 
该 指令 指定 的 地 址 去 执行 ,这 种 操作 只 影响 到 程序 计数 郑 CPC) 的 内 容 , 如 Intel 80x86 的 
JMP 和 人 

) 条 件 转 移 指 

条 件 转移 指令 是 指 仅 当 满 用 和 令 规 定 的 条 件 时 , 才 执 行 转 移 ; 否则 只 相当 于 一 条 空 操 
作 指 令 ,不 改变 程序 执行 顺序 。 条 件 转 移 指令 一 般 常 跟 在 比较 或 测试 指令 之 后 ,根据 测试 条 
件 是 否 满足 来 决定 是 否 转移 ， 由 于 这 种 指令 可 使 计算 机 根据 条 件 ( 输 入 数据 处理 或 处 理 结 
果 ) 来 选择 程序 执行 方 回 ,因此 条 件 转移 指令 使 机 需 具 有 逻辑 判断 能 力 。 

一 般 用 来 作为 转移 条 件 的 标志 有 进位 标志 (C) 、 结 果 为 零 标 志 (Z) 、 结 果 为 负 标 志 (N) 
和 结果 溢出 标志 (V) 等 ,也 可 以 利用 这 些 标 志 的 组 合作 为 转移 条 件 ， 如 - Intel 80x86 的 JZ、 
JC 等 指令 。 

3) 转子 程序 与 返回 指令 

通常 , 子 程序 是 一 组 可 以 共享 的 指令 序列 ,在 执行 主 程序 的 过 程 中 ,可 被 多 次 调用 ,甚至 
可 被 不 同 的 程序 所 调用 。 只 要 给 出 子 程序 的 入口 地 址 就 能 从 主 程序 转 入 子 程 序 。 转 子 程 序 
操作 与 转移 指令 之 间 的 区 别 在 于 : 转移 指令 无 须 返 回 , 不 必 保 存 返 回 地 址 ; 而 转子 指令 必 
须 以 菏 种 方式 保存 返回 地 址 ,以 便于 于 程序 执行 结束 返回 到 调用 程序 的 断 点 ,如 Intel 
80x86 的 CALL.、RET 指令 。 

4) 程序 中 断 指令 

中 断 是 计算 机 内 部 突 发 事件 或 由 1/O 设备 请 求 而 随机 产生 的 。 但 有 些 计算 机 为 了 方 
便 程序 调试 或 调用 某 种 功能 等 目的 ,设置 有 专门 的 程序 中 断 指令 ,如 Intel 80x86 的 INT 指 
令 。 当 程序 运行 该 类 指令 时 ,就 以 中 断 方式 暂停 后 续 指 令 的 执行 ,然后 将 程序 断 点 参数 保 
存 ,接着 转向 某 地 址 执行 某 段 程序 .实现 所 期 望 的 功能 ,如 查 错 、 显 示 结 果 等 。 由 于 这 些 指令 
是 由 软件 驱动 的 ,所 以 又 称 为 软 中 二 
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5. 输入 输出 类 指令 


输入 输出 类 指令 是 用 来 启动 外 围 设备 ,检查 测试 外 围 设备 的 工作 状态 ,实现 外 围 设备 与 
主机 之 间 , 或 外 围 设备 与 外 围 设备 之 间 的 信息 交换 。 不 同 计算 机 的 输入 输出 方式 差别 很 大 ， 
A 

独立 编 址 方式 设置 专用 的 输入 输出 指令 ,指令 中 应 给 出 与 存储 磊 地 址 无 关 的 设备 码 ( 或 
疹 口 地 址 ) ,而 指令 操作 人 码 规定 本 指 - 今 要 求 的 输入 输出 操作 ， 包括 输入 、 输 出 、 启 动 等 ,如 
Intel 80x86 的 IN、OUT 等 指令 ， 

所 谓 统一 编 址 就 是 把 输入 输出 设备 寄存 器 和 主 存单 元 统一 编 址 。 在 这 种 方式 下 ,用 一 
般 的 数 据 传送 指令 来 实现 输入 输出 操作 。 一 个 输 人 输出 设备 通 稼 至 少 有 三 个 寄存 融 : 数据 
寄存 器 、 命 令 寄存 器 和 状态 寄存 需 。 每 个 寄存 髓 都 可 以 由 分 配给 它们 的 唯一 的 主 存 地 址 来 
识别 ,主机 可 以 像 访问 主 存 一 样 去 访问 输入 输出 设备 的 寄存 器 。VAX-11 机 采用 的 就 是 统 
一 编 址 方式 , 它 把 最 高 的 4KB 主 存 地 址 作为 输入 输出 设备 寄存 上 需 的 地 址 。 


6. 特权 指令 


特权 指令 是 指 具 有 特殊 权限 的 指令 , 它 用 于 多 用 户 、 多 任务 计算 机 的 系统 资源 分 配 与 管 
理 。 这 类 指令 的 功能 包括 : 改变 系统 的 工作 方式 ,检测 用 户 的 访问 权限 ,修改 虚拟 存储 融 管 
理 的 段 表 、 页 表 , 完 成 任务 的 创建 和 切换 等 。 为 了 安全 ,这 类 指令 一 般 不 直接 提供 给 用 户 使 
用 ,如 Pentium 中 的 SGDT LSIJINVD 等 。 


处 理 需 控制 指令 是 直接 控制 CPU 实现 某 种 功能 的 指令 。 包 括 状 态 标 志 位 的 操作 指 
令 .停机 指令 .等 待 指令 、 空 操作 指令 .封锁 总 线 指 令 等 ,如 Intel 80x86 中 的 STC、WAIT.、 
NOP.,. LOCK 


知识 拓展 


x86CPU 指令 系统 的 扩展 指令 集 

目前 市 面 上 Intel 和 AMD 的 处 理 器 在 x86 基本 指令 集 的 基础 上 ,为 了 提升 处 理 器 各 方 
面 的 性 能 ,又 各 上 自 开 发 新 的 指令 集 。 

MMX 指令 集 ; 它 是 Intel 公司 为 Pentium MMX 处 理 器 所 开发 的 多 媒体 指令 集 。 
MMX 指令 集中 包括 了 57 条 多 媒体 指令 ,通过 这 些 指 令 可 以 一 次 性 处 理 多 个 数据 。 使 用 
MMX 指令 集 的 好 处 就 是 所 使 用 的 操作 系统 可 以 在 不 做 任何 改变 的 情况 下 执行 MMX 指 
令 。 但 是 ,MMX 指令 集 不 能 与 x86 的 浮 点 运算 指令 同时 执行 。 

SSE 指令 集 : SSE 指令 集 叫 单 指令 多 数据 流 (SIMD) 扩 展 。 它 最 先 运用 于 Pentium 亚 
处 理 器 ,可 以 提高 处 理 器 浮 点 性 能 , 它 共 有 70 条 指令 ,其 中 包含 提交 3D 图 形 运算 效率 的 50 
条 SIMD 浮 点 运算 指令 .12 条 MMX 整数 运算 增强 指令 .8 条 优化 内 存 中 的 连续 数据 块 传送 
指令 。 理 论 上 这 些 指 令 对 图 像 处 理 、 浮 点 运算 、3D 运算 、 多 媒体 处 理 等 众多 多 媒体 的 应 用 能 

力 起 到 了 全 面 提 升 的 作用 。SSE 指令 包含 了 3DNow! 指令 集 (3DNow! 是 AMD 公司 运用 
于 AMD 的 K6、K6-2 和 K7 系列 处 理 器 中 的 指令 集 ) 的 绝 大 部 分 功能 ,只 是 实现 的 方法 不 同 
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而 已 。Pentium 4 发布 之 后 ,Intel 又 推出 了 更 先进 的 SSE2 指令 集 。SSE2 包含 了 144 条 指 
令 , 由 SSE 指令 集 和 MMX 指令 集 两 部 分 组 成 。SSE 部 分 主要 负责 处 理 浮 点 数 ,而 MMX 
部 分 则 专门 计算 整数 。SSE2 的 寄存 器 容量 是 MMX 寄存 器 的 两 倍 , 在 指令 处 理 速 度 保持 不 
变 的 情况 下 ,通过 SSE2 优化 后 的 程序 和 软件 运行 速度 也 能 够 提高 两 倍 。 

SSE3 指令 是 目前 规模 最 小 的 指令 集 , 它 只 有 13 条 指令 。 和 包括 数据 传输 命令 .数据 处 理 
命令 .特殊 处 理 命令 .优化 命令 、 超 线程 性 能 增强 五 个 部 分 ,SSE3 可 以 提升 处 理 器 的 超 线 程 
的 处 理 能 力 。 

上 面 外 绍 的 扩展 指令 集 , 对 于 处 理 器 的 性 能 提升 受到 IA-32 体系 的 限制 ,x86 架构 基本 
上 不 会 再 有 县 有 革命 性 意义 的 指令 集 出 现 ,Intel 和 AMD 都 已 经 把 重心 转向 了 64 位 体系 
架构 的 处 理 器 指令 集 开 发 上 。 


3.2 指令 格式 


计算 机 的 指令 格式 与 机 天 的 字 长 .存储 器 的 容量 及 指令 的 功能 都 有 很 大 的 关系 。 从 便 
于 程序 设计 ,增加 基本 操作 并 行 性 .提高 指令 功能 的 角度 来 看 ,指令 中 应 包含 多 种 信息 。 但 
在 有 些 指 令 中 ,由 于 部 分 信息 可 能 无 用 ,这 将 浪费 指令 所 占 的 存储 空间 ,并 增加 了 访 存 次 数 ， 
也 许 反 而 会 影响 速度 。 因 此 ,如 何 合理 、 科 学 地 设计 指令 格式 ,使 指令 既 能 给 出 足够 的 信息 
又 使 其 长 度 尽 可 能 地 与 机 需 字 长 相 匹配 ， 以 节省 存储 空间 ,缩短 取 指 时 间 , 提 高 机 器 的 性 能 ， 
这 是 指令 格式 设计 中 的 一 个 重要 问题 。 

计算 机 是 通过 执行 指令 来 处 理 各 种 数据 的 。 为 了 指出 所 执行 的 操作 、 数 据 的 来 源 及 操 
作 结 果 的 去 问 ,一 一 条 指令 必须 包 合 下 列 信 息 。 

(1) 操作 码 : 它 具 体 说 明了 操作 的 性 质 及 功能 。 一 人 台 计 算 机 可 能 有 几 十 条 至 几 百 条 指 
令 , 每 一 条 指令 Rareu 计算 机 通过 识别 该 操作 码 来 完成 不 同 的 操作 。 

(2) 操作 效 的 地 址 : CPU 通过 该 地 址 就 可 以 取得 所 需 的 操作 如 

(3) 操作 结果 的 存储 地 址 : 把 对 操作 数 的 处 理 结果 保存 在 该 地 址 中 ,以 便 再 次 使 用 。 

(4) 下 条 指令 的 地 址 : 执行 程序 时 ,大 多 数 指 令 按 顺序 依次 从 主 存 中 取出 执行 。 只 有 
在 遇 到 转移 指令 时 ,程序 的 执行 顺序 才 会 改变 。 为 了 压缩 指令 的 长 度 , 可 以 用 一 个 程序 计数 
俘 (Program Counter,PC) 存 放 指 令 地 址 。 每 执行 一 条 指令 ,PC 中 的 指令 地 址 就 日 动 加 1 
( 设 该 指令 只 占 一 个 主 存 单元 ) ,指出 将 要 执行 的 下 一 条 指令 的 地 址 。 当 遇 到 执行 转移 指令 
时 , 则 用 转移 地 址 修改 PC 的 内 容 。 由 于 使 用 了 PC, 指 令 中 就 不 必 明 显 地 给 出 下 一 条 将 要 
执行 指令 的 地 址 。 

从 上 述 分 析 可 知 , 一 条 指令 实际 上 包括 两 种 信息 , 即 操作 码 和 地 址 码 。 因 此 ,一 条 指令 
的 结构 可 用 如 图 3-1 所 示 的 形式 来 表示 。 


图 3-1 指令 结构 


3.2.1 指令 字 长 
指令 字 长 是 指 一 条 指令 中 所 包含 的 二 进 制 代码 的 位 数 , 也 就 是 指令 的 长 度 ， 


第 3 章 ”汇编 纹 机 瑚 组 织 


指令 字 长 取决 于 操作 码 的 长 度 .地 址 码 的 个 数 及 长 度 。 指 令 字 长 与 机 天 字 长 没有 固定 
的 关系 , 它 可 以 等 于 机 融 字 长 ,也 可 以 大 于 或 小 于 机 天 字 长 。 字 长 较 短 的 小 型 .微型 机 中 ,大 
多 数 指令 的 长 度 可 能 大 于 机 器 字 长 ; 而 在 字 长 较 长 的 大 .中 型 机 中 ,大 多 数 指令 的 长 度 则 往 
往 小 于 或 等 于 机 顺 字 长 。 通 篆 , 把 指令 字 长 等 于 机 天 字 长 的 指令 称 为 单字 长 指令 ,指令 字 长 
等 于 半 个 机 带 字 长 的 指令 称 为 半 字 长 指令 ,指令 字 长 等 于 两 个 机 天 字 长 的 指令 称 为 双 字 长 
指令 。 例 如 ,IBM 370 系列 机 ,其 指令 格式 有 16 位 ( 半 字 ) 的 ,有 32 位 (单字 ) 的 ,还 有 48 位 
(一 个 半 字 ) 的 。 

在 指令 系统 中 , 奉 指 令 的 长 度 随 指令 功能 而 异 , 称 为 变 长 指令 结构 。 不 同 的 指令 可 以 有 
不 同 的 长 度 , 即 需 长 则 长 . 需 短 则 短 。 但 因为 主 存 一 般 是 按 字 节 编 址 的 ,所 以 指令 字 长 多 为 
字 节 的 整数 倍 。 如 在 Pentium 系列 机 中 ,指令 长 度 是 可 变 的 ,有 1 字 节 、2 字 节 、4 字 节 、8 字 
节 , 最 长 的 有 12 字 节 。 原 则 上 讲 , 短 指令 比 长 指令 好 ,主要 是 它 能 节省 存储 空间 ,提高 取 指 
令 的 速度 ,但 有 其 局 限 性 。 长 指令 可 能 会 占用 两 个 或 多 个 地 址 , 取 指 令 的 时 间 相 对 来 说 就 要 
长 些 , 但 可 以 扩大 寻 址 范围 或 可 以 市 几 个 操作 数 。 两 者 各 有 有 所 长 ,如 果 长 , 短 指令 可 在 同一 
机 合 中 混合 使 用 ,就 会 给 系统 市 来 很 大 的 灵活 性 。 

到 目前 为 止 ,主流 PC 和 传统 的 大 .中 、 小 型 机 仍 广泛 采用 复杂 指令 系统 ,广泛 采用 变 长 
指令 格式 。 变 长 结构 指令 系统 比较 灵活 ,能 充分 利用 指令 字 的 每 一 位 代码 ,但 指令 的 控制 较 

在 一 个 指令 系统 中 , 寿 所 有 指令 的 长 度 都 是 相等 的 , 称 为 定 长 指令 结构 。 和 是 长 结构 指令 
系统 控制 和 测 单 ,但 不 够 灵活 。 为 了 获得 更 高 的 执行 速度 ,及 取 精简 指令 系统 人 RISC, 它 采用 和 是 
长 结构 指令 ,该 技术 可 三 沁 用 于 工作 站 类 的 高 档 微 机 ,或 米 用 众多 的 RISC 处 理 兹 构成 大 规 
模 并 行 处 理 阵列 。 


3.2.2 地 址 码 


根据 一 条 指令 中 有 几 个 地 址 码 , 可 将 该 指令 称 为 几 操 作 数 指令 或 几 地 址 指令 。 一 般 的 
操作 数 有 源 操 作 数 ,目的 操作 数 及 操作 结果 这 三 种 数 , 因 而 就 形成 了 三 地 址 指令 格式 ,这 是 
早期 计算 机 指令 的 基本 格式 。 在 三 地 址 指令 格式 的 基础 上 ,后 来 又 发 展 成 二 地 址 格式 ,一 地 
址 格式 和 和 去 地 址 格式 。 各 种 不 同 操作 数 的 指令 格式 如 图 3-2 所 示 。 


= 地 址 指 人 


地址 指 人 
地址 指 人 
零 地 址 指令 


图 3-2 指令 格式 


1. 三 地 址 指令 


三 地 址 指令 字 中 有 三 个 地 址 码 , 其 功能 为 
Ai3<(Al) OP (A,) 
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式 中 ,OP 表示 操作 性 质 , 如 加 , 减 、 乘 、 除 等 ; A1、A,、A; 可 以 是 内 存单 元 的 地 址 ,也 可 以 是 运 
算 器 中 通用 寄存 器 的 地 址 ,A 为 源 操作 数 地 址 , A; 为 目的 操作 数 地 址 , A; 为 存放 操作 结果 的 
地 址 ; 一 表示 把 操作 结果 传送 到 指定 的 地 方 。 

这 种 格式 的 指令 长 度 比较 长 ,小 型 .微型 机 中 很 少 使 用 。 


2. 二 地 址 指令 


二 地 址 指令 和 常 称 为 双 操 作 数 指令 , 它 的 两 个 地 址 码 分 别 指明 参 与 操作 的 两 个 操作 数 存 
放 的 内 存单 元 地 址 或 通用 寄存 髓 的 名 称 。Ai; 为 源 操作 数 地 址 ,A; 为 目的 操作 数 世 
作 存 放 操 作 结果 的 地 址 。 指 令 执 行 之 后 ,A, 地 址 中 原来 存放 的 内 容 已 被 覆盖 了 ,其 功能 为 

A,<—(Al) OP (A,) 
地 址 指令 格式 中 ,从 操作 数 的 物理 位 置 来 说 ,又 可 归结 为 三 种 类 型 。 
人 存储 天 -存储 着 (SS) 型 指令 : 操作 数 痢 存放 在 内 存单 元 中 ,从 内 存 某 单 元 中 取 操 作 数 

操作 结果 存放 至 内 存 男 一 单元 中 ,因此 机 器 执 行 这 种 指令 需要 多 次 访问 内 存 。 

寄存 器 -寄存 器 (RR) 型 指令 . 这 类 指令 中 可 使 用 通用 寄存 带 组 或 个 别 专 用 琳 存 各 存放 
操作 数 ,从 寄存 髓 中 取 操 作 数 ,把 操作 结果 放 到 另 一 寄存 固 。 机 器 执行 寄存 髓 -寄存 骨 型 指 
令 的 速度 很 快 ,因为 执行 这 类 指令 ,不 需要 访问 内 存 。 

寄存 器 -存储 器 (RS) 型 指令 。 这 类 指令 的 一 个 操作 数 存 放 在 通用 寄存 器 组 中 的 某 个 寄 
存 右 , 男 一 个 操作 数 存 放 在 内 存单 元 。 执 行 此 类 指令 时 , 既 要 访问 内 存单 元 ,又 要 访问 寄 
存 峰 。 

二 地 址 指令 是 最 常见 的 指令 格式 ,在 各 种 计算 机 的 指令 系统 中 广 记 采用 。 


3. 一 地 址 指令 


一 地 址 指令 中 只 给 出 一 个 地 址 ,该 地 址 既是 操作 数 的 地 址 ,又 是 操作 结果 的 存储 地 址 。 
如 加 1 减 1 和 移 位 等 单 操作 数 指令 均 采 用 这 种 格式 ,其 操作 过 程 是 对 这 一 地 址 所 指定 的 操 
作 数 执行 相应 的 操作 后 ,得 出 的 结果 又 存 回 该 地 址 中 ,其 功能 为 

Ai<—OP(A1) 
男 一 种 情况 是 以 CPU 中 的 累加 寄存 器 (AC) 的 内 容 作 为 一 个 隐 含 操作 数 , 指 令 的 地 址 码 A 
指明 的 是 为 一 个 操作 数 , 操 作 结 果 又 送 回 累加 寄存 带 (AC) ,其 功能 为 
AC——(AC)OP(A) 


4. 零 地 址 指令 


地 地 址 指令 格式 只 有 操作 人 码 字 段 。 这 种 格式 可 用 于 只 需 操 作 码 字段 而 不 需要 操作 如 
指令 ,如 停机 、` 空 操作 清除 等 控制 指令 。 

但 对 于 某 些 需要 操作 数 的 算术 .逻辑 类 指令 也 可 以 用 雪 地 址 指令 来 实现 ,这 时 操作 数 地 
址 是 隐 售 的。 如 对 际 加 套 AC 的 内 容 进行 操作 ,其 AC 为 隐 含 约定 时 可 用 委 地 址 。 be 
计算 机 中 的 算术 .逻辑 类 指令 就 是 委 地 址 指令 ,此 时 参加 运算 的 操作 数 放 在 堆栈 中 ,运算 结 
和 也 放 在 堆栈 中 (有 关 扒 栈 的 详细 内 容 在 后 面 介 绍 ) 。 


5. 多 地 址 指令 


东 些 性 能 较 好 的 大 、 中 型 机 其 至 高 档 小 型 机 中 ,往往 设置 一 些 功 能 很 强 的 ,用 于 人 处理 成 
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批 数据 的 指令 ,如 字符 串 处 理 指 令 . 回 量 和 矩阵 运算 指令 等 。 为 了 描述 一 批 数 据 ,指令 中 需 
要 多 个 地 址 来 指出 数据 存放 的 首 地 址 .长度 和 下 标 等 信息 。 例 如 ,CDC STAR-100 的 矩阵 
运算 指令 ,其 地 址 码 部 分 有 ?7 个 地 址 段 , 用 来 指出 两 个 和 矩阵 的 数据 存放 情况 及 结果 的 存放 
情况 。 
指令 中 的 地 址 个 数 的 选取 要 考虑 诸多 因素 。 从 缩短 程序 长 度 . 用 户 使 用 方便 和 增加 操 
作 并 行 度 等 方面 来 看 ,选用 多 地 址 指令 格式 较 好 ; 从 缩短 指令 长 度 ,减少 访 存 次 数 , 商 化 硬 
ta dpi 一 地 址 指令 格式 较 好 。 对 于 同一 个 问题 ,用 三 地 址 指令 编写 的 程序 行 数 
最 少 ,但 程序 目标 代码 的 长 度 最 长 ; 而 用 二 一、 和 雪 地 址 指令 来 编写 程序 ,程序 行 数 一 个 比 一 
pad 目标 代码 的 长 度 一 个 比 一 个 短 。 表 3-] 给 出 了 不 同 地 址 数 指令 的 特点 及 适用 


表 3-1 不 同 地 址 数 指令 的 特点 及 适用 场合 
地 址 数量 程序 长 度 者 : 执行 速度 适用 场合 
三 地 址 短 最 大 一 般 向 量 .矩阵 运算 为 主 
二 地 址 一 般 大 较 慢 广泛 使 用 
一 地 址 较 长 较 大 较 快 连续 运算 ,硬件 结构 简单 
零 地 址 较 长 最 小 最 快 舱 套 .递归 问题 


3.2.3 控 作 码 


指令 系统 的 每 一 条 指令 部 有 一 个 唯一 的 用 二 进 制 代码 表示 的 操作 人 码 (Operation Code， 
OP) , 它 用 来 表示 该 指令 应 进行 什么 性 质 的 操作 ， 如 进行 加 法 .减法 .乘法 .除法 .数据 传送 
等 ,其 长 度 取决 于 指令 系统 中 的 指令 条 数 和 编码 格式 。 

指令 操作 码 主 要 有 两 种 编码 格式 : 固定 长 度 格式 和 可 变 长 度 格式 。 


1. 固定 长 度 操作 码 


操作 码 的 长 度 固定 , 且 集 中 放 在 指令 字 的 一 个 字段 中 。 这 种 格式 对 于 简化 刹 件 设计 \ 减 
少 指令 译 码 时 间 非 常 有 利 , 在 字 长 较 长 的 大 .中 型 机 和 超级 小 型 机 以 及 RISC 上 被 广泛 采 
用 。 寿 某 机 天 的 操作 码 字 段 长 度 为 天 位 , 则 它 最 多 能 表示 条 条 不 同 指令 。 如 IBM 370 机 
( 字 长 32 位 ) 其 操作 码 字 段 都 是 8 位 ,8 位 操作 码 允 许 指定 256 条 指令 ， 而 实际 上 在 IBM 370 
机 中 只 有 183 条 指令 ,存在 看 较 大 的 信息 见 余 。 


IBM 370 机 的 指令 可 分 为 三 种 不 同 的 长 度 形式 : 半 字 长 指令 .单字 长 指令 和 一 个 半 字 


长 指令 。 半 字 长 指令 不 包含 主 存 地 址 ,单字 长 指令 只 指明 一 个 主 存 地 址 ,一 个 半 字 长 指令 则 
给 出 两 个 主 存 地 址 ,共有 5 种 格式 ,如 图 3-3 所 示 。 

【 例 3. 1】 机 器 字 长 为 16 位 ,指令 格式 如 图 3-4 所 示 , 其 中 OP 为 操作 码 , 试 分 析 该 指 
令 格式 的 特点 。 

解 : 

(1) 单字 长 二 地 址 指令 ; 

(2) 操作 码 字 段 OP 为 7 位 ,最 多 能 表示 128 条 不 同 指令 ; X 字段 用 于 寻 址 方式 ; 

(3) 源 寄 存 右 和 目的 寄存 融 都 是 通用 寄存 毅 ( 可 分 别 指定 16 个 ) ,所 以 是 RR 型 指令 ， 
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图 3-3 IBM 370 机 的 指令 格式 


15 9 8 7 4 3 0 
图 3-4 例 3.1 图 
两 个 操作 数 均 在 寄存 兹 中 ; 
(4) 这 种 指令 结构 常用 于 算术 逻辑 运算 类 指令 。 
【 例 3.2】 机 器 字 长 为 16 位 ,指令 格式 如 图 3-5 所 示 ,OP 为 操作 码 字 段 , 试 分 析 指 令 
格式 特点 。 


| 9 5 了 4 . 


位 移 量 (16fi7) 


图 3-5 例 3.2 图 


解 : 

(1) 双 字 长 二 地 址 指令 ,用 于 访问 存储 大 

(2) 操作 码 字 段 OP 为 7 位 ,最 多 能 表示 128 条 不 同 指令 ; X 字段 用 于 寻 址 方式 ; 

(3) 一 个 操作 数 在 源 寄存 器 ( 共 16 个 ) , 另 一 个 操作 数 在 存储 器 中 (由 变 址 寄存 器 和 位 
移 量 决定 ), 所 以 是 RS 型 指令 。 


2. 可 要 长 度 探 作 码 


可 变 长 度 格式 操作 码 不 但 长 度 可 变 , 而 且 分 散 地 放 在 指令 字 的 不 同 字 段 中 。 方 法 是 : 
当 指 令 中 的 地 址 码 位 数 较 多 时 ,让 操作 码 的 位 数 少 些 ; 当 指 令 中 的 地 址 码 位 数 减少 时 ,让 操 
作 码 的 位 数 增多 ,以 增加 指令 种 类 , 称 之 为 扩展 操作 码 。 这 样 既 能 充分 利用 指令 字 的 各 个 字 
段 , 又 能 在 不 增加 指令 长 度 的 情况 下 扩展 操作 码 的 长 度 , 使 它 能 表示 更 多 的 指令 。 这 种 格式 
在 字 长 较 短 的 小 型 和 微型 机 上 广泛 采用 ,如 PDP-117/VAX-11 Intel 80x86 和 Pentium 等 ， 
PDP-11 机 的 指令 分 为 单字 长 ,二 字 长 ,三 字 长 三 种 ,操作 码 字 段 占 4 一 16 位 不 等 ,可 遍及 整 
个 指令 长 度 。 其 部 分 指令 格式 ,如 图 3-6 所 示 。 

显然 ,操作 码 长 度 不 固定 将 增加 指令 译 码 和 分 析 的 难度 ,使 控制 器 的 设计 复杂 化 ,因此 
对 操作 人 码 的 编码 至 关 重 要 。 通 常 是 在 指令 字 中 用 一 个 固定 长 度 的 字段 来 表示 基本 操作 码 。 
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单字 长 
191L op | D 


双 字 长 一 一 一 
kr 
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图 3-6 ”PDP-11 的 指令 格式 


例如 , 设 某 机 器 的 指令 字 长 度 为 16 位 ,包括 一 个 4 位 的 基本 操作 码 字 段 和 三 个 4 位 地 
址 码 字 段 , 其 格式 如 图 3-7 所 示 。 


图 3-7 指令 格式 


4 位 基本 操作 人 码 有 16 种 编码 组 合 , 厂 全 部 用 于 表示 三 地 址 指令 , 则 有 16 条 。 但 是 , 奢 
三 地 址 指令 仅 需 15 条 ,两 地 址 指令 需 15 条 ,一 地 址 指令 需 15 条 , 零 地 址 指令 需 16 条 , 共 61 
条 指令 ,应 如 何 安 排 操 作 码 ? 显然 ,只 有 4 位 基本 操作 码 是 不 够 的 ,必须 将 操作 码 的 长 度 回 
地 址 码 字 段 扩 展 才 行 。 一 种 可 供 扩展 的 方法 和 步 又 如 下 . 

(1) 15 条 三 地 址 指令 的 操作 人 码 由 4 位 基本 操作 人 码 从 0000 一 1110 给 出 , 剩 下 1111 用 于 
把 操作 码 扩 展 到 Ai , 即 4 位 扩展 到 8 位 。 

(2) 15 条 二 地 址 指令 的 操作 码 由 8 位 操作 码 从 11110000 一 11111110 给 出 , 剩 下 
11111111 用 于 把 操作 码 扩 展 到 A, , 即 从 8 位 扩展 到 12 位 。 

(3) 15 条 一 地 址 指令 的 操作 码 由 12 位 操作 码 从 111111110000 一 111111111110 给 出 ， 
剩 下 111111111111 用 于 把 操作 的 扩展 到 A;, 即 从 12 位 扩展 到 16 位。 

(4) 16 条 去 地 址 指令 的 操作 人 码 由 16 位 操作 码 从 1111111111110000 一 1111111111111111 
Ee 


一 一 一 各 


般 将 指令 操作 人 码 放 在 指令 字 的 第 一 字 市 , 当 读 出 操作 人 码 后 就 可 马上 判定 : 是 一 条 单 
操作 数 指令 还 是 一 条 双 操 作 数 指令 ,或 者 是 零 地 址 指令 ,从 而 知道 后 面 还 应 该 取 几 个 字 节 指 
令 代 码 。 当 然 , 在 来 取 预 取 指 令 技 术 时 ,这 个 问题 会 复杂 一 些 。 

实际 上 ,在 可 变 长 度 操作 码 的 指令 系统 设计 中 有 一 个 重要 的 原则 ,就 是 使 用 频率 高 的 指 
令 应 分 配 短 的 操作 码 ,使 用 频率 低 的 指令 相应 地 分 配 较 长 的 操作 码 , 喻 夫 曼 (Huffman) 编 码 
法 就 是 根据 上 述 原则 进行 编码 的 。 这 样 不 仅 可 以 有 效 地 缩短 操作 码 在 程序 中 的 平均 长 度 ， 
节省 存储 髓 空间 ,而 且 缩 短 了 使 用 频率 高 的 指令 的 译 码 时 间 ,提高 了 程序 的 运行 速度 。 

【 例 3.3】 指令 字 长 为 12 位 ,每 个 地 址 码 为 3 位 ,采用 扩展 操作 码 的 方式 ,设计 4 条 三 
地 址 指令 、255 条 一 地 址 指令 和 8 条 雪 地 址 指令 。 

(1) 写 出 扩展 表示 ; 

(2) 画 出 指令 幸 人 码 逻 辑 图 ; 

(3) 计算 操作 码 平 均 长 度 。 
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解 : 
(1) 操作 码 的 扩展 表示 如 下 : 
000XXX 多 多多 XXX 久久 

: /4 条 三 地 址 指令 
011XXXXXXXXX- 
100000000X XX 

: : 255 条 一 地 址 指令 
111111110X x Xx 
111111111000 


111111111111 
辑 图 如 图 3-8 所 示 。 


3:8 译 码 蜗 


(2) 指令 诺 码 站 


已 
日 


寄存 器 


8:256 详 食 奉 3:8 详 伯 鲜 


Yo YI YY YY YY 


洋 友 | | 
Tit 


Y254 Y255 YoY]l Y2 Y3 Y4YsY6Y7 


、 / 
4 条 三 地 址 指令 235 条 一 地 址 指令 8 条 等 地 址 指令 


图 3-8 ”指令 译 码 逻辑 图 
(3) 指令 操作 码 平 均 长 度 二 (4X3 十 9X255 十 12X8)/267 二 9( 位 )，。 
3. 指令 助 记 符 


由 于 硬件 只 能 识别 1 和 0, 所 以 采用 二 进 制 操 作 码 是 必要 的 ,但 是 用 二 进 制 代码 来 书写 
程序 却 非 第 诬 烦 。 为 了 便于 书 瑟 和 阅读 程序 ,每 条 指令 通 第 用 3 个 或 4 个 瑞 文 绒 写 字母 来 
表示 ,这 种 缩写 码 叫 做 指令 助 记 符 , 如 表 3-2 所 示 。 这 里 假定 指令 系统 只 有 7 条 指令 ,所 以 
操作 码 只 需 3 位 二 进 制 。 


表 3-2 ”典型 的 指令 助 记 符 


指令 助 记 符 二 进 制 操作 码 
ADD 001 
SUB 010 
MOYV 011 
J MP 100 
CALL 101 
口上 上 110 
LDA 1]11 
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由 于 指令 助 记 符 提示 了 每 条 指令 的 意义 ,因此 比较 容易 记忆 ,书写 起 来 比较 方便 ,阅读 
程序 容易 理解 。 例 如 ,一 条 加 法 指令 ,可 以 用 助 记 符 ADD 来 代表 操作 码 001; 而 一 条 数据 
传送 指令 ,可 以 用 助 记 符 MOV 来 代表 操作 码 011。 

由 指令 助 记 符 构成 的 指令 称 为 汇编 指令 ,讨论 指令 系统 时 为 了 方便 ,经 第 使 用 汇编 指 
令 。 需 要 注意 的 是 ,在 不 同 的 计算 机 中 ,指令 助 记 符 的 规定 是 不 一 样 的 ,如 80x86 系列 CPU 
的 汇编 指令 与 MCS-51 单片机 的 汇编 指令 是 不 同 的 。 

便 件 只 能 识别 和 执行 二 进 制 语 言 , 因 此 ,汇编 指令 还 必须 转换 成 与 它们 相对 应 的 二 进 制 
人 码 。 这 种 转换 借助 汇编 程序 可 以 自动 完成 ,汇编 程序 相当 于 一 个 “翻译 ”。 


数据 的 仓储 与 寻 址 万 式 


存储 器 中 存储 的 数据 包括 两 大 类 : 一 是 指令 ,二 是 操作 数 。 
不 同 的 计算 机 会 有 不 同 的 方法 。 
数据 的 存储 万 式 
1. 操作 数 的 存储 万 式 


对 这 些 数据 的 存储 和 寻 址 ， 


机 徊 指令 可 以 对 不 同类 型 的 操作 数 进行 操作 。 操 作 数 的 类 型 有 数值 数据 和 非 数 值 数 
据 ,数值 数据 可 以 是 定点 整数 、 浮 点 数 ,、 十 进 制 数 ,操作 数 的 位 数 可 以 是 字 节 、 字 、 双 字 、 四 字 。 

一 个 多 字 太 的 数据 在 按 字 三 编 址 的 主 存 中 通常 有 两 种 排 厅 方式 : 大 端 次 厅 (big-endian 
ordering) 和 小 端 次 序 (little-endian ordering)。 大 并 次 印 址 什 
序 将 最 高 有 效 字 节 存 储 在 最 小 地 址 单元 ,小 端 次 序 将 
最 低 有 效 字 节 存储 在 最 小 地 址 单元 。 图 3-9 是 4 字 市 

(1) 字符 串 排序 方便 ,因为 字符 串 与 整 型 效 据 的 : 
万 顺 订 一 致 ,在 对 大 痪 次 序 字 符 串 进行 比较 时 , 整 型 
ALU 可 以 同时 比较 多 个 字符 。 

(2) 顺序 的 一 致 性 ,采用 相同 的 顺序 存储 整 型 数 和 字符 串 ,显示 十 进 制 数 以 及 字符 串 很 
方便 ,所 有 的 数值 可 直接 从 左 到 右 顺 序 显示 而 不 会 产生 混 消 。 

来 用 小 端 方 式 的 优点 是 适合 于 超 长 数据 的 算术 运算 ,对 小 端 次 友和 存 人 笃 的 数 
度 算 术 运 算 ,不 需要 寻找 最 低 字 数据 ,然后 反问 移动 到 较 高 位 。 

Intel 80x86、Pentium、VAX 和 Alpah 是 小 痕 次 序 的 处 理 亏 ,IBM S370/390、Motorola 
的 680X0、Sun SPARC 和 大 多 数 RISC 机 右 来 用 大 并 次 厅 ,Power PC 是 一 个 既 支 持 大 并 次 
厅 又 支持 小 端 次 序 的 机 各 。 妆 数据 由 一 种 端 厅 类 型 的 机 大 传 送 到 为 一 类 型 的 机 冀 时 ,或 当 
程序 试图 对 多 和 字 广 数据 的 个 别 字 市 或 个 别 位 进行 处 理 时 ,要 特别 注意 数据 的 存储 次 厅 。 


2. 数据 对 齐 方式 
在 数据 对 齐 存储 方式 下 ,要 求 一 个 数据 字 占 据 完整 的 一 个 字 的 存储 位 置 , 而 不 是 分 成 机 


小 病 方 式 
据 的 存储 方式 


3-9 ”多 字 广 交 


据 进行 高 精 


79 


av 
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部 分 各 占据 一 个 字 存 储 位 置 的 一 部 分 。 例 如 ,一 个 32 位 的 数据 字 ,在 按 字 对 齐 方式 下 它 的 
地 址 应 当 是 4 的 倍数 , 即 其 地 址 的 二 进 制 码 的 最 低 两 位 为 00。 这 样 , 它 实际 占据 的 存储 单 
元 的 地 址 为 4n、4n 十 1、4n 十 2 和 472 十 3(02 为 自然 数 )。 在 32 位 宽度 的 存储 秀 中 ,因为 其 字 地 
址 为 42 ,这 个 数据 可 以 一 次 读 取 或 者 写 人 。 如 果 这 个 数据 字 不 按 对 齐 方式 存储 ,其 存储 单 
元 的 地 址 出 现 如 4n 一 1、4n、4n 十 1 和 4n 十 2 的 情况 ,这 样 的 数据 在 32 位 的 存储 右 需 要 分 两 
次 谈 取 或 者 写 人 。 在 计算 机 中 ,规定 数据 的 存储 必须 按 字 对 齐 的 方式 进行 。 图 3-10(a) 是 一 
个 字 未 对 齐 的 例子 ,图 3-10(b) 是 一 个 字 对 齐 的 例子 。 所 以 在 存储 冀 中 有 些 位 置 是 空 日 的 ， 
这 种 空 日 存储 位 置 是 为 了 保证 后 继 数 据 按 字 对 齐 方 式 存 储 。 


图 3-10 ”存储 器 中 数据 字 的 对 齐 方 式 


3.3.2 和 寻 址 万 式 


计算 机 中 有 两 种 信息 , 即 指令 和 数据 (或 称 操 作 数 ) ,它们 都 存放 在 存储 化 相应 的 存储 单 
元 中 。 运 行程 序 时 ,计算 机 逐条 执行 指令 ,并 对 数据 进行 处 理 。 如 何 从 存储 天 中 找到 所 需要 
的 指令 或 数据 呢 ? 很 明显 ,只 要 找到 它们 在 存储 融 的 有 效 地 址 即 可 。 所 谓 寻 址 方式 , 束 是 形 
成 指令 或 数据 有 效 地 址 的 方法 。 

寻 址 方式 是 指令 系统 设计 的 重要 内 容 。 一 套 好 的 寻 址 方式 能 给 用 户 提供 丰 晤 的 程序 设 
计 手 段 , 能 提高 程序 的 质量 和 存储 空间 的 利用 诗 。 寻 址 方式 是 不 同 计算 机 的 重要 特色 之 一 ， 
它们 对 寻 址 方式 的 分 类 及 寻 址 方式 的 名 称 有 各 目的 规定 。 下 面 介绍 大 多 数 计 自 机 郡 具 有 的 
基本 寻 址 方式 ,有 些 基 本 寻 址 方式 可 以 组 合 使 用 ,从 而 形成 更 复业 的 寻 址 方式 。 


1. 指令 的 寻 址 方式 


指令 的 寻 址 方式 分 为 顺序 方式 和 跳跃 方式 两 种 。 

(1) 顺序 寻 址 方式 。 

组 成 程序 的 指令 序列 在 主 存 中 是 顺序 存放 的 。 因 此 ,执行 程序 是 从 该 程序 的 第 一 条 指 
令 开 始 ,逐条 取出 并 逐条 执行 的 ,这 种 程序 的 顺序 执行 过 程 , 称 为 顺序 寻 址 方式 。 为 了 达到 
顺序 寻 址 的 目的 ,CPU 中 可 以 用 一 个 程序 计数 关 (Program Counter,PC) 对 指令 的 地 址 进行 
顺序 计数 。 

PC 中 开始 是 存放 程序 的 首 地 址 ,然后 每 取出 一 条 指令 ,PC 加 1 或 加 一 个 篆 数 ,以 指出 
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下 一 条 指令 的 地 址 ,和 卫 到 程序 结束 。 指 令 顺 友 寻 址 的 过 程 如 图 3-11 所 示 。 

(2) 患 足 如 址 方式 。 

当 程 序 中 出 现 分 文 或 循环 时 ,就 会 改变 程序 的 执行 顺序 。 此 时 ,对 指令 寻 址 就 要 采取 跳 
跃 寻 址 方式 。 所 请 跳跃 ,就 是 指 下 一 条 指令 的 地 址 不 是 通过 程序 计数 佣 (PC) 加 1 获得 的 ， 
而 古 由 指令 本 号 给 出 的 。 指 令 系 统 中 的 无 条 件 转 移 指 令 和 各 种 条 件 转移 指令 , 束 古 为 跳 哇 
寻 址 方式 而 设置 的 。 跳 跃 寻 址 的 过 程 如 图 3-12 所 示 。 


程序 计数 器 


指令 地 址 | ”指令 内 容 
3 | MP 6 


/ STA 200 


/ 
a ee - 


a ms sa 


图 3-11 指令 顺序 寻 址 方式 图 3-12 指令 跳跃 寻 址 方式 


当 执 行 JMP 指令 时 ,PC 不 加 1, 而 是 将 JMP 指令 中 的 地 址 码 06 送 到 PC ,计算 机 从 06 
地 址 取出 指令 执行 ,之 后 又 顺序 执行 ,直到 再 遇 到 转移 指令 或 程序 结束 。 


2. 操作 数 寻 址 方式 


操作 数 寻 址 方式 就 是 形成 操作 数 有 效 地 址 的 方法 。 由 于 指令 长 度 的 限制 ,指令 中 的 地 
址 码 不 会 很 长 ,而 主 存 的 容量 却 越 来 越 大 。 因 此 把 指令 中 地 址 码 字 段 给 出 的 地 址 称 为 形 
地 址 ,这 个 地 址 有 可 能 不 能 直接 用 来 访问 主 存 , 而 经 过 某 种 运算 后 可 得 到 能 够 直接 访问 主 存 
的 地 址 , 称 为 有 效 地 址 (Effective Address,EA) 。 

设 某 计 算 机 指令 系统 的 单 地 址 指令 结构 如 图 3-13 所 示 。 其 中 ,OP 为 操作 码 ,X 为 寻 址 
特征 码 ,D 为 形式 地 址 或 称 偶 移 量 。 寻 址 过 程 就 是 把 X 和 D 的 不 同 组 合 变换 成 有 效 地 址 的 
过 程 。 和 常用 的 寻 址 方式 有 : 立即 寻 址 .直接 村 址 .间接 寻 址 .相对 村 址 .寄存 大 寻 址 、 变 址 寻 


址 等 。 
EE EE 


图 3-13 单 地 址 指令 结构 


(1) 立即 寻 址 (Immediate Addressing) 。 
的 地 址 码 字 段 指出 的 不 是 操作 数 的 地 址 ,而 是 操作 数 本 身 , 这 种 寻 址 方式 称 为 立即 
寻 址 。 这 种 寻 址 方式 的 特点 是 : 在 取 指 令 时 ,操作 码 和 操作 数 被 同时 取出 ,不 必 再 次 访问 存 
储 偷 , 从 而 提高 了 指令 的 执行 速度 。 但 是 ,因为 操作 数 是 指令 的 一 部 分 ,不 能 被 修改 ,而 且 立 
即 数 的 大 小 受到 指令 长 度 的 限制 ,所 以 这 种 寻 址 方式 灵活 性 较 差 ,通常 用 于 给 某 一 寄存 器 或 
主 存单 元 赋 初 值 。 例 如 Intel 80x86 的 MOV AX,2000H 指令 ,把 立即 数 2000H 传送 给 累 
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加 寄存 熏 AX。 

(2) 直接 寻 址 (Direct Addressing)。 

指令 的 地 址 码 字 段 直接 指出 操作 数 的 有 效 地 址 ,这 种 寻 址 方式 称 为 直接 寻 址 。 此 时 , 特 
征 码 X 指 出 寻 址 方式 是 直接 寻 址 方式 ,形式 地 址 D 给 出 操作 数 的 地 址 。 若 用 EA 代表 有 效 
地 址 , 则 有 EA=D。 例 如 Intel 80x86 的 MOV AX,|2000H | 指令 , 源 操 作 数 的 有 效 地 址 
EA 一 2000H。 直 接 寻 址 过 程 如 图 3-14 所 示 。 

这 种 寻 址 方式 不 需要 做 任何 寻 址 运算 ,简单 直观 ,也 便于 硬件 实现 。 但 随 看 计算 机 主 存 
容量 的 不 断 扩 大 ,所 需 的 地 址 码 将 会 越 来 越 长 。 对 于 和 定 长 指令 ,用 于 表示 地 址 码 字 段位 数 有 
限 ,限制 了 访问 主 存 的 范围 ; 而 对 于 变 长 指令 ,势必 造成 指令 的 长 度 太 长 ,因此 这 种 寻 址 方 

(3) 间接 寻 址 (Indirect Addressing)。 

间接 寻 址 是 相对 直接 寻 址 而 言 的 。 间 接 寻 址 方式 下 ,地址 字段 中 的 形式 地 址 不 是 操作 
数 的 有 效 地 址 ,而 是 操作 数 地 址 的 地 址 。 就 是 说 ,D 指示 的 存储 单元 中 的 内 容 才 是 操作 数 的 
有 效 地 址 ,而 DD 只 是 一 个 间接 地 址 。 此 时 ,特征 码 X 指示 寻 址 方式 为 间接 寻 址 方式 ,有 效 地 
址 EA 一 (D)。 间 接 寻 址 过 程 如 图 3-15 所 示 。 


操作 数 地 址 
计时 到 
操作 数 


图 3-14 直接 寻 址 方式 图 3-15 ”间接 寻 址 方式 


间接 寻 址 扩大 了 寻 址 范围 ,可 用 较 短 的 地 址 访问 大 的 主 存 空 间 。 例 如 : 某 计 算 机 指令 
字 长 16 位 ,指令 中 的 地 址 码 10 位 ,直接 寻 址 空间 为 2”( 二 1K) 个 存储 单元 。 采 用 一 级 间接 
寻 址 后 ,从 存储 器 中 将 取出 16 位 的 有 效 地 址 能 够 访问 25 (= 一 64K) 个 存储 单元 。 

间接 寻 址 中 又 有 一 级 间 址 和 多 级 间 址 之 分 ,如 图 3-15 所 示 的 间接 寻 址 是 一 级 间 址 。 多 
级 间 址 为 取得 操作 数 需要 多 次 访问 主 存 , 对 于 多 级 间 址 来 说 ,在 寻 址 过 程 中 所 访问 到 的 每 个 
主 存单 元 的 内 容 中 都 应 设 有 一 个 间 址 标志 位 。 通 常 将 这 个 标志 位 放 在 主 存单 元 的 最 高 位 。 
当 该 位 为 "1” ,表示 这 一 主 存单 元 中 仍然 是 间接 地 址 ,需要 继续 间接 寻 址 ; 当 该 位 为 “0” 时 ， 
表示 已 经 找到 了 有 效 地 址 ,根据 这 个 地 址 可 以 找到 真正 的 操作 数 。 间 接 寻 址 在 取 指 之 后 至 
少 需要 两 次 访问 主 存 才 能 取出 操作 数 , 降 低 了 指令 执行 的 速度 。 所 以 ,大 多 数 计算 机 只 人 允许 
一 级 间 址 。 

(4) 寄存 其 寻 址 (Register Addressing) 。 

寄存 征 寻 址 是 在 指令 的 地 址 码 字 段 给 出 某 一 个 通用 寄存 病 的 编号 ,这 个 寄存 策 中 存放 
着 操作 数 。 例 如 Intel 80x86 的 MOV AX,DX 指令 , 源 操 作 数 存放 在 DX 寄存 器 中 ,把 它 取 
出 就 可 以 传送 给 累加 寄存 右 AX。 寄 存 器 寻 址 过 程 如 图 3-16 所 示 。 
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如 和 三 前 名 


图 3-16 ”寄存 器 寻 址 方式 


寄存 器 寻 址 的 优点 ; 从 寄存 器 中 存 取 数 据 比 从 主 存 中 快 得 多 ; 由 于 寄存 器 的 数量 较 
少 , 其 地 址 码 字 段 短 ,缩短 了 指令 长 度 , 提 高 了 指令 的 执行 速度 ,在 各 种 计算 机 中 广泛 使 用 。 

(5) 寄存 此 间接 寻 址 (Register Indirect Addressing) 。 

寄存 天 间接 寻 址 是 在 指令 的 地 址 码 中 给 出 荣 一 通用 寄存 大 的 编号 ,在 寄存 着 中 存放 操 
作 数 的 有 效 地 址 ,而 操作 数 则 存放 在 主 存单 元 中 。X 特征 码 表示 寻 址 方式 为 寄存 器 间接 寻 
址 方式 ,有 效 地 址 EA 一 (R)。 例 如 Intel 80x86 的 MOV AX,[BX] 指 令 , 源 操作 数 的 有 效 地 
址 存放 在 BX 寄存 需 中 。 寄 存 骨 间接 寻 址 过 程 如 图 3-17 所 示 。 


R| or | xl D 


图 3-17 ”寄存 器 间接 寻 址 方式 


寄存 甫 间接 寻 址 方式 的 指令 代码 较 短 , 数 多 的 缺点 ,指令 执行 
速度 快 ,是 一 种 广 沁 使 用 的 寻 址 方式 。 此 时 寄存 胡 本 号 被 称 为 加 接地 址 指示 冀 , 在 编程 过 程 
中 常 作为 地 址 指针 ，。 

(6) 相对 寻 址 (Displacement Addressing) 。 

相对 寻 址 是 把 程序 计数 器 (PC) 中 的 内 容 加 上 指令 中 的 形式 地 址 D, 形 成 操作 数 的 有 效 
地 址 。 此 时 ,特征 码 X 指示 为 相对 寻 址 方式 ,PC 中 的 内 容 是 当前 的 指令 地 址 ,这 里 的 “ 相 
对 ”, 就 是 相对 当前 的 指令 地 址 ,所 以 ,操作 数 的 有 效 地 址 为 EA 二 (PC) 十 D。 形 式 地 址 DD 可 
正 \、 可 人 负 , 通 第 用 补 人 码 表 示 ,操作 数 可 在 指令 存储 单元 之 前 或 之 后 。 操 作 数 的 地 址 与 指令 地 
址 之 间 总 是 相差 一 个 固定 值 , 文 持 程 序 在 主 存 中 任意 浮动 。 寻 址 过 程 如 图 3-18 所 示 。 

主 存 


| 
"rT 记 
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(7) 疏 址 寻 址 (Index Addressing) 。 

使 用 一 个 变 址 寄存 器 的 内 容 加 上 位 移 量 D 形成 操作 数 的 有 效 地 址 (EA) , 称 为 变 址 寻 
址 。 这 种 寻 址 方式 与 相对 寻 址 的 区 别 在 于 它 与 本 条 指令 的 地 址 无 关 , 操 作 数 地 址 随 变 址 寄 
存 着 的 内 容 译 动 一 个 D。 变 址 寄存 希 的 内 容 可 由 程序 员 设 置 , 故 寻 址 更 灵活 。 在 具有 变 址 
寻 址 的 指令 中 ,除去 操作 人 码 和 形式 地 址 外 ,还 必须 指明 变 址 寄存 项 。 变 址 寻 址 的 过 程 如 
3-19 所 示 ，。 


IR , 


变 址 寄存 器 


图 3-19 ” 变 址 寻 址 方式 


变 址 寻 址 是 一 种 广泛 米 用 的 寻 址 方式 ,最 典型 的 用 法 是 将 指令 中 的 形式 地 址 作为 基准 
地 址 ,而 变 址 寄存 顺 的 内 容 作 为 修改 量 。 在 遇 到 需要 频 篆 修改 地 址 时 无 须 修改 指令 ,只 要 修 
改变 址 值 就 可 以 了 ,这 对 于 数组 运算 .字符 串 操 作 等 成 批 效 据 处 理 是 很 有 用 的 。 例 如 Intel 
80x86 的 MOV AX,TABLELSIJ] 指 令 , 源 操作 数 的 有 效 地 址 EA 一 (SD 十 TABLE,SI 是 变 
址 寄存 天 ,TABLE 是 数组 或 字符 串 的 基准 地 址 ,在 此 作为 位 移 量 D。 

(8) 基 址 寻 址 (Base Addressing) 。 

基 址 寻 址 是 将 基 址 寄存 天 Rs 的 内 容 与 指令 中 给 出 的 位 移 量 D 相 加 ,形成 操作 数 有 效 地 
址 , 即 EA 二 (Rs) 十 D。 当 特征 码 X 指明 是 基 址 寻 址 时 ,要 指定 一 个 寄存 右 来 存放 寻 址 的 基 
准 值 ,这 个 寄存 带 称 为 基 址 寄存 右 ,指令 的 地 址 码 字 段 是 一 个 可 正 .可 负 的 位 移 量 。 基 址 寻 
址 如 图 3-20 所 示 。 


ror [xl 5 


基 址 寄存 硼 
Rn 基地 址 


图 3-20 ” 基 址 


基 址 寻 址 和 变 址 寻 址 在 形成 有 效 地 址 时 所 用 的 方法 是 相同 的 ,而 且 在 一 些 计 自 机 中 ,这 
两 种 寻 址 方式 都 是 用 同样 的 硬件 来 实现 的 。 它 们 两 者 的 区 别 是 : 这 两 种 寻 址 方式 应 用 的 场 
合 不 同 , 变 址 寻 址 是 面 问 用 户 的 ,用 于 访问 字符 串 ` 辐 量 和 数组 等 成 批 数 据 ; 而 基 址 寻 址 面 
问 系 统 , 主 要 用 于 锡 部 地 址 和 物理 地 址 间 的 变换 ,用 以 解决 程序 在 主 存 中 的 再 定位 和 坟 大 寻 
址 空间 等 问题 。 
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(9) 段 寻 址 (Segment Addressing) 。 

7 段 寻 址 是 一 种 为 了 扩大 寻 址 范围 而 采用 的 技术 ,在 Intel 8088/8086 等 处 理 肯 中 使 用 。 
8088/8086 处 理 带 字 长 16 位 ,因此 , 寻 址 范围 只 有 2 六 王 64KB, 而 处 理 带 的 直接 寻 址 范围 可 
达到 2 王 1MB, 其 中 的 奥妙 就 是 采用 了 段 寻 址 方式 。 有 具体 方法 是 将 1MB 的 存储 空间 以 
64KB 为 单位 分 为 右 干 段 ,在 形成 操作 数 的 有 效 地 址 时 ,由 一 个 基地 址 加 上 某 寄 存 郑 提供 的 
16 位 偏 移 量 以 形成 20 位 物理 地 址 ,这 个 基地 址 由 CPU 中 的 段 寄 存 器 提供 。 形 成 20 位 物 
理 地 址 时 , 段 寄 存 兹 中 的 内 容 目 动 左 移 4 位 ,然后 与 偏 移 量 相 加 , 即 形 成 所 需 的 20 位 地 址 。 
段 寻 址 过 程 如 图 3-21 所 示 。 


仿 移 地 址 


一 一 
(Ai 
| 


ee 


图 3-21 段 寻 址 方式 


(10) 复合 寻 址 (Composite Addressing ) 。 

复合 寻 址 是 把 两 种 或 两 种 以 上 的 基本 寻 址 方式 组 合 在 一 起 的 寻 址 方式 。 如 间接 寻 址 方 
式 与 变 址 寻 址 或 相对 寻 址 方式 结合 而 形成 的 寻 址 方式 。 

以 上 介绍 了 一 些 第 用 的 基本 寻 址 方式 。 对 于 某 类 型 计算 机 的 指令 系统 ,可 能 只 用 了 上 
述 寻 址 方式 的 一 部 分 或 条 些 基 本 方式 髓 加 上 几 种 变形 的 写 址 方式 。 只 要 熟悉 了 以 上 的 寻 址 
址 指令 或 多 地 址 指令 中 ,各 地 址 人 码 的 


方式 ,其 他 的 寻 址 方式 是 很 容易 理解 的 。 男 外 ,在 双 霸 
寻 址 方式 可 能 不 同 , 请 读者 注意 。 
【 例 3.4】 一 种 二 地 址 RS 型 指令 的 结构 如 图 3-22 所 示 。 
601 4 位 | 位 2 位 16 位 
通用 寄存 三 X 位 移 量 (D) 


图 3-22 RS 型 指令 结构 


其 中 工 为 间接 寻 址 标志 位 ,X 为 寻 址 模式 字段 ,D 位 移 量 宇 段 。 通 过 工 X,D 的 组 合 , 可 
构成 如 表 3-3 所 示 的 寻 址 方式 。 请 写 出 表 中 6 种 寻 址 方式 的 名 称 。 


表 3-3 寻 址 方式 


寻 址 方式 I X 有 效 地 址 EA 算法 说 明 
(1) 0 00 EA=D 
(2) 0 01 EA 一 (PC) 十 /一 D PC 为 程序 计数 器 
(3) 0 10 EA 一 (R:) 十 /一 D R: 为 变 址 寄存 器 
(4) 1 11 EA= (R;) 
(5) 1 00 EA= (D) 
(6) 0 11 EA 王 (Ri ) 十 /一 D Ri 为 基 址 寄存 器 
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解 : (1) 直接 寻 址 ; (2) 相对 寻 址 ; (3) 变 址 寻 址 ; 
(4) 寄存 器 间接 寻 址 ; (5) 间接 寻 址 ; (6) 基 址 寻 址 。 


3. 堆栈 寻 址 方式 


最 后 考虑 堆栈 寻 址 (Stack Addressing) 方 式 。 堆 栈 (Stack) 是 一 种 位 置 的 线性 序列 , 它 
的 存 取 顺序 是 “后 进 先 出 ”(Last In First OQut)。 堆 栈 是 一 个 预 留 的 位 置 块 ,数据 项 是 被 陆 经 
加 到 栈 项 的 ,在 任何 时 刻 ,堆栈 的 位 置 块 是 部 分 被 填充 的 。 扒 栈 寻 址 方式 是 一 种 隐 含 寻 址 ， 
各 含 地 指示 对 楼 顶 位 置 的 数据 执行 操作 。 

堆栈 的 设置 通常 有 两 种 方式 : 硬 堆 栈 和 软 扒 栈 。 硬 堆栈 是 利用 CPU 中 的 一 组 专门 的 
寄存 器 来 组 成 的 , 硬 堆栈 的 容量 有 限 。 软 堆栈 是 通过 执行 相关 指令 ,把 主 存储 器 中 的 一 段 存 
储 区 定义 为 堆栈 ,利用 一 个 通用 寄存 合作 为 堆栈 指针 (Stack Pointer,SP) ,并 设置 SP 的 初 
值 。 目 前 大 多 数 计算 机 中 都 支持 软 堆栈 , 软 堆 
对 存储 表 寻 址 的 指令 来 对 堆栈 中 的 多 

2) 堆栈 的 工作 方式 

将 数据 存 人 堆栈 的 操作 称 为 “ 进 栈 (PUSH)”, 从 堆栈 中 取出 数据 的 操作 称 为 “出 栈 
(POP)”, 出 楼 后 相应 单元 的 数据 不 再 保留 。 最 先进 栈 的 数据 位 于 堆栈 的 底 闹 ( 栈 底 ) ,最 后 
进 栈 的 数据 位 于 堆栈 的 项 端 ( 栈 项 ), 进 栈 和 出 栈 操 作 均 在 栈 硕 进行 。 图 3-23 表示 了“ 进 栈 ” 
操作 的 情况 。 


堆栈 堆栈 


低地 址 | 低地 址 


(SP)=100H 
(A)=a 


sp opadam 


SP 100HL( 栈 项 ) 100H 


进 栈 以 前 进 栈 以 后 
图 3-23” 进 栈 操作 


在 执行 进 栈 操作 前 , 设 堆栈 指针 (CSP) 王 100H ,通用 寄存 器 (A) 一 “ ,假如 现在 把 通用 寄 
存货 A 中 的 数据 送 入 堆栈 ,那么 执行 “ 进 栈 ”指令 后 ,SP 目 动 “ 减 1” 成 为 0OFFH( 十 六 进 制 )， 
数据 a 被 压 人 存储 单元 0OFFH ,SP 始终 指 回 栈 顶 (最 后 存 人 数据 的 堆栈 单元 ), 因 此 进 栈 操 


作 可 描述 如 下 : 


SP<—(SP)—1,Msp<—(A) 
其 中 (A) 表 示 通 用 寄存 硕 A 的 内 容 ,SP 表示 堆栈 指针 , Msp 表示 
单元 。 
图 3-24 表示 了 “出 让 


堆栈 指针 指示 的 栈 顶 


"操作 的 情况 ， 


第 3 章 ” 谍 编 纹 机 瑚 组 织 


(SP)=0FDH 
(B)=? 


(SP)=0FEH 
(B)=c 


| 出 栈 以 后 


假定 出 栈 操作 之 前 ,堆栈 中 已 存 人 a.b.c 三 个 数 ,堆栈 指针 (CSP) 王 OFEDH, 要 求 把 堆栈 
中 的 数据 送 到 通用 寄存 大 了 ,那么 执行 “出 栈 ? 操 作 后 ,就 把 当前 栈 顶 单元 的 内 容 c 送 到 了 也， 
堆栈 指针 SP 修改 为 OFEH 

出 栈 操作 可 描述 如 下 : 


B<—(Msp) ,SP<-(CSP) 十 1 
要 注意 的 是 ,有 的 机 责 进 栈 操 作 时 ,SP 由 低地 址 回 高 地 址 变化 ; 出 栈 操作 时 ,SP 巾 高 
地 址 辐 低 地 址 变化 。 
除了 利用 堆栈 暂时 存 取 数 据 外 ,在 执行 转子 程序 指令 .中断 指 令 要 用 到 堆栈 , 子 程序 以 
岗 套 .递归 调用 也 离 不 开 堆 栈 。 


3.4 RISC 

从 计算 机 指令 系统 设计 的 角度 看 ,计算 机 的 体系 结构 可 分 为 复杂 指令 系统 计算 机 
(Complex Instruction Set Computer, CISC) 和 精简 指令 系统 计算 机 (Reduced Instruction 
Set Computer, RISC)。CISC 仍 是 当前 计算 机 体系 结构 的 主流 ,而 RISC 则 是 近 20 年 来 迅 
速 发 展 的 一 种 体系 结构 。 本 市 介绍 RISC 的 发 展 和 特点 。 

长 期 以 来 ,计算 机 性 能 的 提高 往往 是 通过 增加 硬件 的 复杂 性 来 获得 的 。 随 看 集成 电路 
技术 ,特别 是 超大 规模 集成 电路 (VLSI 技术 的 迄 速 发 展 , 为 了 软件 编程 方便 和 提高 程序 的 
运行 速度 , 便 件 工程 师 采 用 的 办 法 是 不 断 增 加 可 实现 复杂 功能 的 指令 和 多 种 灵活 的 寻 址 方 
式 ,其 至 某 些 指令 可 支持 高 级 语言 语句 归 类 后 的 复杂 操作 ,致使 硬件 越 来 越 复 洒 , 造 价 也 相 
应 提高 。 为 实现 复杂 操作 ,处理 需 除 回程 序 员 提 供 各 种 寄存 顺和 复杂 功能 机 器 指令 外 ,还 通 
过 存 于 只 读 和 存储 熏 (ROM) 中 的 微 程序 来 实现 其 极 强 的 功能 ,处 理 各 在 分 析 每 一 条 指令 之 后 
执行 一 系列 微 指令 来 完成 所 需 的 功能 ,这 种 设计 称 为 复兴 指令 集 计 算 机 结构 。 一 般 CISC 
计算 机 所 含 的 指令 数目 至 少 有 300 条 以 上 ,有 的 甚至 超过 500 条 。 


3.4.1 精简 指令 集 计 算 机 的 出 现 


采用 复杂 指令 系统 的 计算 机 有 着 较 强 的 处 理 高 级 语言 的 能 力 , 这 对 提高 计算 机 的 性 能 
是 有 益 的 。 当 计算 机 的 设计 沿 着 这 条 道路 发 展 时 ,有 些 人 回 过头 去 看 一 看 过 去 走 过 的 道路 ， 
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ini hn IBM 2 oh ol 于 1975 有 SC 本 


帝 性 能 . Li pa Patterson PP olap eet ripened 
展 这 一 研究 ,结果 表明 ,CISC 存在 许多 缺点 。 

首先 ,在 这 种 计算 机 中 ,各 种 指令 的 使 用 频率 相差 悬殊 : 一 个 典型 程序 的 执行 过 程 所 使 
用 的 80% 指 令 , 只 占 一 rp 20M 。 事 实 上 最 频 索 使 用 的 指令 是 存 数 、 取 数 
和 加 运算 这 些 最 简单 的 指令 ,这 样 一 来 ,长 期 致力 于 复 洒 指令 系统 的 设计 ,实际 上 是 在 设计 
一 种 难得 在 实践 中 用 得 上 的 指令 系统 的 处 理 器 ， 同时 ,复杂 的 指令 系统 必然 市 来 结构 的 复 
杂 性 ,这 不 但 增加 了 设计 的 时 间 Wp ,还 容易 造成 设计 失误 。 

此 外 ,在 CISC 中 ,许多 复杂 指令 需要 极 复 杂 的 操作 ,这 类 指令 多 数 是 某 种 喜 级 语言 上 
woridrimyweempweaMeeg 让 Non 
简单 指令 的 运行 速度 。 

因此 ,针对 CISC 的 这 些 丙 病 ,1975 年 IBM 公司 John Cocke 提出 了 精简 指令 系统 的 设 
想 。 到 了 1979 年 ,美国 加 州 大 学 伯 殉 莱 分 校 由 Patterson 教授 领导 的 研究 小 组 ,首先 提 出 了 
RISC 这 一 术语 , 即 指令 系统 应 当 只 包含 那些 使 用 频率 很 蜗 的 少量 指令 ,并 提供 一 些 必要 的 
指令 以 支持 操作 系统 和 高 级 语言 ,按照 这 个 原则 发 展 而 成 的 计算 机 被 称 为 精简 指令 集 计 算 
机 ,人 简称 RISC。Patterson 教授 领导 的 人 研究 小 组 先后 研制 了 RISC- 工 和 RISC-I 计算 机 。 
1981 年 美国 的 斯 坦 福 大 学 在 Hennessy 教授 领导 下 的 人 研究 小 组 研制 了 MIPS RISC , 蝇 调 高 
效 的 流水 线 和 采用 编译 方法 进行 流水 调度 ,使 得 RISC 技术 设计 风格 得 到 很 大 补充 和 发 展 。 


3.4.2 精简 指令 集 计 算 机 特点 


RISC 是 在 CISC 的 成 功 技术 并 克服 CISC 缺点 的 基础 上 产生 并 发 展 起 来 的 
为 ,RISC 计算 机 具有 下 列 特点 。 


1. 充分 利用 VLSI 芯片 的 面积 


CISC 机 融 的 控制 种 大 多 采用 微 程 序 控制 ,其 控制 存储 着 在 CPU 已 片 内 所 占 的 面积 为 
50 和 以 上 ,而 RISC 机 需 的 控制 硕 玉 用 组 合 逻 辑 控 制 , 其 便 布 线 逻 辑 只 占 CPU 芯片 面积 的 
10% 左 右 ,; 可 见 它 可 将 空 出 的 面积 供 其 他 功能 部 件 使 用 。 这 样 ， 在 相同 的 和 集成 电路 制造 技术 
条 件 下 ,同样 的 芯片 面积 上 可 实现 更 多 的 并 行 部 件 , 如 超级 流水 线 .多 核 后。 


2. 提高 计算 机 运算 速度 


。 一般 认 


RISC 机 善 提高 运算 速度 ,主要 反映 在 以 下 5 个 方面 : 

(1) AR 到 
令 种 类 少 , 指 令 规 整 简单、 基本 寻 址 方式 有 2 一 3 种 。 

(2) RISC 机 器 内 大 量 使 用 寄存 器 ,数据 处 理 指 令 只 对 寄存 器 进行 操作 ,只 有 加 载 / 存 储 
指令 可 以 访问 存储 器 ,以 提高 指令 的 执行 效率 。 

(3) RISC 机 器 采用 寄存 器 窗口 重 荆 技术 ,程序 柑 套 时 不 必 将 
中 ,又 提高 了 执行 速度 。 

(4) RISC 机 兹 采用 组 合 逻 辑 控 制 比 末 用 微 程 序 控制 的 CISC 机 带 的 延 开 小 , 缩 短 了 


导 存 售 内 容 保 存 到 存储 毅 


第 3 章 “ 谍 编 纹 机 瑚 组 织 


CPU 周期 。 
(5) RISC 机 器 选用 精简 指令 系统 ,适合 于 流水 线 工作 ,大 多 数 


指令 在 一 个 时 钟 周期 内 完成 。 
3. 便于 设计 ,可 降低 成 本 ,提高 可 靠 性 


RISC 指令 系统 价 单 , 故 机 条 设计 周期 短 
现 ， 可 靠 性 高 。 


;逻辑 人 简单, 设计 出 错 可 能 性 小 ,有 错 也 容易 发 


4. 有 效 支 持 高 级 语言 程序 


由 于 RISC 指令 系统 指令 少 , 寻 址 方式 少 ,使 编 详 程序 容 多 选择 更 有 效 的 指令 和 寻 址 方 
而 且 由 于 RISC plein 量 安排 寄存 融 的 操作 ,使 编译 程序 的 代码 优 
, 统 徘 优化 编 洋 来 更 有 效 地 文 持 高 级 请 言 程序 。 
日 前 在 中 高 档 服务 器 中 普遍 采用 这 种 指令 令 系 统 的 处 理 器 ,特别 是 高 档 服务 需 全 都 采用 
RISC 指令 系统 的 CPU,RISC 指令 系统 更 加 适合 高 档 服 务 器 的 UNIX 和 类 UNIX 操作 系 
红 。 在 中 高 档 服务 闫 中 及 用 RISC 指令 的 CPU 主要 有 : PowerPC 人 处理 如 、SPARC 处 理 兹 、 
PA-RISC 处 理 器 、MIPS 处 理 器 、Alpha 处 理 器 等 。 

当然 ,和 CISC 结构 相 比 较 , 尽 管 RISC 结构 有 上 述 的 优点 ,但 绝 不 能 认为 RISC 结构 就 
可 以 完全 取代 CISC 结构 ,事实 上 ,RISC 和 CISC 各 有 优势 ， 而 且 界 限 并 不 那么 明显 。 现 在 
有 些 上 典型 的 CISC 处 理 乾 中 ,内 部 加 入 RISC 的 特性 ,如 Intel 公司 的 80486、Pentium 系列 
CPU 就 融合 了 RISC 和 CISC 的 优势 。 


=" 


3.5 指令 系统 举例 


前 面 几 贡 主 要 介绍 了 指令 的 格式 、 寻 址 方式 、 指 令 的 操作 类 型 ,本 节 通 过 对 Pentium 指 
令 系 统 和 SPARC 指令 系统 的 和 商 介 , 加 座谈 者 对 指令 系统 的 理解 。 
3.5.1 Pentium 微 处 理 器 指令 系统 


Pentium 指令 集 包 含 8086/8088 以 及 80486 的 全 部 指令 ,其 目的 是 为 了 实现 兼容 性 。 
但 Pentium 指令 集 在 其 基础 上 增加 了 一 些 指令 ,有些 指令 的 操作 数 可 以 是 32 位 ,有 些 指 令 
的 功能 得 到 了 扩充 。 下 面 对 其 指令 结构 作 话 细 的 分 析 介 绍 。 


1. Pentium 的 数据 类 型 


数 是 指令 的 操作 对 象 ,在 Pentium 中 可 处 理 的 数据 类 型 的 长 度 有 宇和 、 字 、 双 字 、 
四 字 ,还 有 一 些 特 丈 的 数据 类 型 ,如 表 3-4 所 示 。 


2. Pentium 指令 格式 


Pentium 指令 集 所 有 指令 的 长 度 一 般 在 1 一 12 个 宇 节 间 变 化 , 它 根据 需要 包括 一 个 或 
多 个 前 组 (限定 指令 操作 时 的 属性 )， 这 种 非 固定 长 度 的 指令 格式 是 典型 的 CISC 结构 特征 。 
EE 容 ,二 是 希望 能 给 编 详 


| 
Pentium 指令 集 的 变 长 指令 格式 ,一 是 为 了 与 它 的 前 身 80486 保持 : 
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器 的 编写 者 提供 更 有 效 的 代码 ,Pentium 指令 格式 如 图 3-25 所 示 。 
表 3-4 Pentium 的 数据 类 型 
说 明 


包括 8 位 /16 位 /32 位 无 符号 数 ,分 别 对 应 于 字 节 、 字 、 双 字 


以 补 码 形 式 表 示 ,其 最 高 位 是 符号 位 ,其 余 位 是 数值 位 ,支持 8 位 、16 位 、32 位 、64 位 
( 浮 点 单元 ) 有 符号 整 狐 


有 单 精 度 实数 、 双 精度 实数 .扩展 精度 实数 

组 合 的 BCD 数据 (每 个 字 节 包含 两 位 十 进 制 数 ) , 非 组 合 的 BCD 数据 (每 个 字 节 只 含 
一 位 十 进 制 数 ,高 四 位 为 0) 

串 数据 是 一 串 连续 的 数据 ,可 由 字 节 组 成 也 可 由 字 或 双 字 组 成 

ASCII 码 是 基于 拉丁 字母 的 一 套 电脑 编码 系统 ,主要 用 于 显示 现代 英语 和 其 他 西欧 
语言 , 它 是 现今 最 通用 的 单字 节 编 码 系统 ,并 等 同 于 国际 标准 ISO/IEC 646 

指针 数据 指出 给 定数 据 在 存储 器 中 的 地 址 ,包括 : 近 程 指针 一 一 32 位 逻辑 地 址 , 即 
32 位 段 内 偏 移 量 ,用 于 段 内 数据 访 吕 \ 

由 16 位 段 选择 符 和 32 位 偏 移 量 组 成 ,用 于 段 间 数据 访问 或 段 间 转移 


0 或 1 0 或 1 0 或 ] 0 或 1( 子 呈 数 ) 


得 令 且 级 让 取代 操作 数 长 度 取代 地 址 长 度 取 代 


(a) 用 级 


1 或 2 0 或 ] 0 或 ] 0/1/214 011/2/4( 字 节 数 ) 


| Reg 或 ’ 人 说 攻 名 Ar 上 类 
ry a re ET 


1 3{37 3 位 ”2 位 3 位 3 位 
(p) 扯 令 


图 3-25 ”Pentium 指令 格式 


下 面 分 别 具 体 介绍 。 
前 级 是 可 选项 ,其 作用 是 对 其 后 的 指令 本 身 进行 约定 。 这 些 前 缀 
但 使 用 这 些 前 级 之 后 ,指令 就 有 了 新 的 属性 。 
指令 前 级 一 一 包括 LOCK( 锁 定 ) 前 级 和 重复 前 级 。LOCK 前 级 用 于 多 处 理 器 环境 中 
对 共享 存储 天 的 排他 性 访问 。 重 复 前 缀 用 于 字符 串 的 重复 操作 ,以 获得 比 软 件 循环 方法 更 
快 的 速度 。 
段 取 代 前 绥 一 一 根据 指令 的 定义 和 程序 的 上 和 下文, 一 条 指令 所 使 用 的 段 寄 存 器 名 称 可 
以 不 出 现在 指令 格式 中 ,这 称 为 段 缺 省 规则 。 当 要 求 一 条 指令 不 按 缺 省 规则 使 用 某 个 段 寄 
仔 敬 轩 ,必须 用 眉 取 代 甫 者 胃 确 指 明 此 眉 琳 行 沉 。 
度 取 代 前 级 和 地 址 长 上 度 取 代 前 弘一 一 在 实地 址 模式 下 ,操作 数 和 地 址 的 默认 
长 度 是 16 位 ; 在 保护 模式 F ,由 有 段 描述 符 中 的 了 位 来 确定 默认 长 度 , 苦 D=1, 操 作 数 和 地 
A 32 位 , 奢 D 一 0, 二 者 的 默认 长 度 是 16 位 。 
令 本 和 号 由 操作 码 字 段 ,、Mod-R/M 字段 ,SIB 字段 ,位 移 量 字段 、 立 即 妆 
外 -人 4 人 可 选 字 段 。 
主 操作 ， 没 占 一 到 两 个 字 节 ,这 个 操作 码 可 以 定义 较 小 的 编码 字段 。 
Mod-R7M 一 一 规定 了 存储 器 操作 数 的 寻 址 方式 ,给 出 了 寄存 器 操作 数 的 寄存 舌 地 址 


并 不 改变 执行 的 内 容 . 


级 


字段 组 成 。 
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号 。Pentium 指令 集中 几乎 所 有 的 引用 存储 顺 操 作 数 的 指令 都 有 这 个 字段 , 它 占 用 寻 址 方 
式 字 节 的 高 两 位 (Mod) 和 低 三 位 CR/7ZM) ,用 来 显示 指定 指令 所 需 操 作 数 的 寄存 需 或 是 存储 
艇 寻 址 方式 ,比如 默认 的 段 选择 符 、. 是否 有 偶 移 量 等 ,计算 有 效 地 址 的 偏 移 量 、 基 址 、. 变 址 . 比 
例 因子 每 信息 由 寻 址 方式 字段 指定 。 

SIB 一 一 该 域 占 用 一 个 字 节 ,只 作为 32 位 寻 址 方式 (基地 址 十 比例 关 变 址 十 Disp) 的 补 
充 。SIB 字 贡 的 第 7 和 第 6 位 是 比例 域 。 在 所 有 的 情况 下 ,比例 域 可 能 的 取 值 为 00.01、10、 
11 这 4 种 情况 ,对 应 的 比例 值 分 别 为 1.2.4.8。SIB 字 节 的 第 5 一 第 3 位 是 变 址 域 , 它 指定 
一 个 32 位 的 寄存 天 为 变 址 寄存 需 。SIB 字 节 的 第 2 一 第 0 位 是 基 址 域 , 它 指出 用 作 有 效 地 
址 的 基地 址 寄存 善 操作 数 。 

位 移 量 一 一 指令 中 直接 给 出 寻 址 方式 所 需 的 位 移 量 。 当 为 存储 器 寻 址 时 , 它 是 一 个 计 
算 有 效 地 址 或 程序 相对 地 址 的 常量 ,根据 W 位 以 及 当前 操作 模式 16 位 /32 位 ,位 移 量 可 以 是 
1.2.4 字 节 。 一 般 位 移 量 有 三 种 形式 : 有 符号 相对 位 移 量 ,无 符号 相对 位 移 量 和 绝对 位 移 量 。 

立即 数 一 一 指令 中 直接 给 出 操作 数 , 其 范围 是 从 去 字 有 到 四 个 字 节 。 如 有 条 在 编码 中 有 


这 一 个 域 , 则 包含 一 个 被 用 作 指 令 操 作 数 或 日 变量 的 第 量 。 
3. Pentium 的 寻 址 方式 


Pentium 的 外 部 地 址 总 线 宽度 是 36 位 ,但 它 也 支持 32 位 物理 地 址 空间 。 在 实地 址 模 
式 下 ,逻辑 地 址 形式 为 段 寻 址 方式 : 将 段 名 所 指定 的 段 寄 存 副 内容 (16 位 ) 左 移 4 位 , 低 4 位 
补 全 0 ,得 到 20 位 段 基 地 址 ,再 加 上 16 位 段 内 偶 移 , 即 得 20 位 物理 地 址 。 在 保护 模式 下 ,32 
位 段 基 地 址 加 上 段 内 偶 移 得 到 32 位 线性 地 址 ,由 存储 管理 部 件 将 其 转换 成 32 位 的 物理 地 址 。 

Pentium 主要 有 9 种 寻 址 方式 ,其 中 有 7 种 实现 对 存储 带 操 作 数 寻 址 。Pentium 的 寻 址 
方式 如 表 3-5 所 示 。 


表 3-5 Pentium 的 寻 址 方式 
序 与 寻 址 方式 名 称 有 效 地 址 EA 计算 说 明 
(1) 立即 寻 址 操作 数 在 指令 中 
(2) 寄存 震 寻 址 操作 数 在 某 寄存 器 中 ,指令 给 出 寄存 器 号 
(3) ”直接 寻 址 EA= Disp Disp 为 俩 稀 量 
(4)” 基 址 寻 址 EA= (B) B 为 基 址 寄存 器 
(5)” 基 址 十 偏 移 量 EA= (B) 二 Disp 
(6) ”比例 变 址 十 偏 移 量 EA= (1) * S++ Disp I 为 变 址 寄存 器 ,S 为 比例 因子 
(7)” 基 址 十 变 址 十 偏 移 FEA 王 (B) 十 (TD 十 Disp 
(8) ” 基 址 十 比例 变 址 十 偏 移 量 EA=(B) 十 (D * S 十 Disp 
(9) ”相对 寻 址 指令 地 址 = 一 (PC) 十 Disp ”PC 为 程序 计数 器 或 当前 指令 指针 寄存 器 


下 面 对 32 位 寻 址 方式 作 几 点 说 明 。 

(1) 立即 数 可 以 是 8 位 16 位 32 位 。 

(2) 寄存 名 地 址 : 一 般 指令 或 使 用 8 位 通用 寄存 一 ,或 使 用 16 位 通用 寄存 各 ,或 使 用 
32 位 通用 寄存 器 。 对 64 位 浮 点 数 操作 ,要 使 用 一 对 32 位 寄存 人 能。 少数 指令 以 段 寄存 兢 来 
实施 寄存 器 寻 址 方式 。 

(3) 直接 寻 址 : 也 称 偏 移 量 寻 址 方式 , 偏 移 量 长 度 可 以 是 8 位 、16 位 、32 位 。 


92 


MV 


计算 机 组 织 与 结构 


(4) 基 址 寻 址 : 基 址 寄存 髓 也 可 以 是 上 述 通 用 寄存 舌 中 的 任何 一 个 。 基 址 寄存 般 B 的 
内 容 为 有 效 地 址 。 

(5) 基 址 十 偏 移 量 寻 址 : 基 址 寄存 器 B 是 32 位 通用 寄存 器 中 的 任何 一 个 。 

(6) 比例 地 址 十 偏 移 量 寻 址 : 也 称 为 变 址 寻 址 方式 , 变 址 寄存 紫 I 是 32 位 通用 寄存 关 
中 除 ESP 外 的 任何 一 个 ,而 且 可 将 此 变 址 寄存 右 内 容 乘 以 1.2、4 或 8 的 比例 因子 S, 然 后 再 
加 上 偏 移 量 而 得 到 有 效 地 址 。 

(7) 8) 两 种 寻 址 方式 是 (4) (6) 两 种 寻 址 方式 的 组 合 , 此 时 仿 移 量 可 有 可 无 。 

(9) 相对 寻 址 : 适用 于 转移 控制 类 指令 。 用 当前 指令 指 针 寄生 全 EIP 或 IP 的 内 容 ( 下 

一 条 指令 地 址 ) 加 上 一 个 有 符号 的 偏 移 量 ,形成 CS 段 的 段 内 偏 移 。 


4. Pentium 操作 类 型 


Pentium 指令 集 完 全 包含 80486 指令 集 , 而 80486 指令 系统 是 一 种 典型 的 CISC 指令 ， 
全 部 指令 可 分 为 三 大 类 : 整 型 类 指令 、 浮 点 类 指令 ,特权 指令 。 

整 型 类 指令 完成 对 整数 的 操作 ,具体 又 可 以 分 为 若干 组 : 数据 传送 、 二 /十 进 制 算术 运 
算 .逻辑 操作 循环 移 位 操作 .字符 串 操 作 位 测试 与 字 节 操作 .控制 转移 操作 、 标 志 控 制 、 段 
寄存 善 以 及 其 他 指令 。 

浮 点 类 指令 是 由 浮 点 部 件 (FPU) 所 执行 的 指令 ,用 来 对 浮 点 数 、 扩 展 的 整形 数 、 二 进 制 
编码 的 十 进 制 (BCD) 数 等 操作 数 进 行 操 作 。 

特权 指令 用 于 实现 系统 级 的 功能 , 像 加 载 系统 级 寄存 费 (GDTR、IDTR、LDTR 等 )、 管 

理 高 速 缓存 .管理 中 断 或 设置 调试 寄存 璐 等 。Pentium 的 操作 类 型 如 表 3-6 所 示 。 
表 3-6 ”Pentium 的 操作 类 型 


操作 说 有 明 
在 寄存 器 和 存储 器 之 间或 寄存 器 之 间 传 送 : 
PUSH/POP 将 数据 进 栈 / 出 栈 
PUSHA 将 所 有 通用 寄存 占 的 内 容 压 人 堆栈 
数据 传送 MUY = 入 传送 字 节 、 字 、 双 字 , 符 号 被 扩展 
LEA rae 
XLAT 
IN/OUT 


| 
Pu | 
FF 


AND 

BTS 位 测试 并 置 人 

BSF 扫描 一 个 字 节 或 字 
逻辑 运算 SHL/SHR 逻辑 左 移 /逻辑 右 移 

SAL/SAR 算术 左 移 / 算 术 右 移 

ROL/ROR 循环 左 移 /循环 右 移 


控制 转移 


串 操作 
高 级 语言 
支持 


标志 控制 


段 寄 存 央 


系统 控制 


保护 


CALL 

JE/JZ 
LOOPE/LOOPZ 
INT/INTO 


LDS/ LES/ LSSLFS/ LGS 
HLT 
LOCK 


SGDT 
LSI 
VERR/VERW 
INVD 


WBINVD 


INVLPG 


3.5.2 SPARC 指令 系统 


最 早 采 用 RISC 思想 的 计 : 


Super SPARC 、Ultra SPARC,. SGI 2 


Power PC,DEC 2 


将 标志 加 
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续 表 
操作 说 明 
无 条 件 转移 
转子 程序 ,并 把 断 点 压 信 堆栈 
如 果 相 等 则 转移 
如 果 相 等 则 循环 
中 断 指 令 
传送 字 节 . 字 、 双 字 的 串 
加 载 字 节 ,. 字 、 双 字 的 串 
生成 一 个 可 以 用 来 实现 块 结构 高 级 语言 规则 的 栈 
为 ENTER 的 道 
检查 阵列 的 边界 
置 进位 标志 
载 到 AH 寄存 器 
将 指针 送 寄 存 器 和 DS.、ES.SS、FS、GS 
保持 原状 态 
封锁 总 线 , Pentium 可 独占 存储 器 
指示 后 面 的 指令 文 持 高 精度 整数 和 浮 点 数 计算 
处 理 器 处 于 等 待 状 态 ,直到 BUSY 信号 撤除 
保存 全 局 描述 符 表 


将 段 限 装 人 一 个 用 户 指 定 的 寄存 器 中 

读 / 写 核查 段 

将 内 部 cache 清空 

将 更 改行 写 回 寄存 兹 后 将 内 部 cache 清空 


使 一 个 转换 后 的 TLB 无 效 


算 机 系统 是 TBM 801, 以 后 又 人 研制 成 RISC-]、RISC-1] 及 
MIPS 计算 机 等 。 目 前 的 许多 处 理 机 都 采用 了 RISC 体系 结构 ,如 Sun 公司 的 : 
\ 司 的 人 4000、R5000、R10000,IBM 公司 的 Power、 
\ 司 的 Alpha,HP 公司 的 HP3000/930 系列 .950 系列 等 。 


下 面 以 SPARC 


为 例 来 说 明 RISC, 它 是 一 个 32 位 字 长 的 计算 机 ,共有 75 条 指令 。 
1. 指令 类 型 和 指令 格式 


SPARC 机 有 以 下 6 种 指令 类 型 ， 


(1) 算术 运算 .逻辑 运算 、 移 位 指令 ; 
又 数 (LOAD)7 存 灼 


(3) 控制 转移 指令 ; 
(4) 谈 / 写 专用 寄存 天 指令; 
(5) 浮 点 运算 指令 ; 
(6) 协 处 理 融 指令 。 


XCSTORE) 指 日 今 
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SPARC 共有 3 种 指令 格式 ,如 表 3-7 所 示 。 
表 3-7 SPARC 的 3 种 指令 类 型 


格式 1 31 30 29 28 0 
CALL 指令 Disp30( 偏 移 量 ) 
格式 2 31 30 29 28 25 24 22 21 0 


sz 和 [op op in 
31 30 28 25 24 19 18 l4 13 12 9 4 0 


格式 3 OP: Rs Rs 
其 他 指令 OP, |Rs | 2 | Simm 


其 中 OP、 oi OP; 为 指令 操作 人 码 ,OPi 为 浮 点 指令 操作 人 码 。 为 了 增加 立即 数 和 偏 移 量 
的 长 度 , 有 3 条 指令 的 操作 码 缩 短 了 ,其 中 CALL 是 子 程序 调用 指令 ,BRANCH 是 转移 类 
指令 ,SETHI 指令 的 功能 是 将 22 位 立即 数 左 移 10 位 , 送 入 Ra 所 指示 的 寄存 器 中 ,然后 再 
执行 一 条 加 法 指令 以 补充 后 面 10 位 二 进 制 数据 ,从 而 形成 32 位 字 长 的 数据 。 

Rs 、Rs: 为 通用 寄存 器 地 址 ,用 作 源 操作 数 寄存 器 地 址 或 地 址 寄存 部 地 址 。 

Ra 为 目标 寄存 器 地 址 ,目标 寄存 需 用 来 保存 运算 结果 或 用 来 存储 髓 取 来 的 数据 。 但 是 
在 执行 存 数 指令 时 ,保存 的 则 是 源 操 作 数 ,并 将 此 操作 数 送 往 指定 的 存储 器 单元 地 址 中 。 

Simml3 是 13 位 扩展 符号 的 立即 数 。 运 算 时 奉 其 最 高 位 为 1, 则 最 高 位 前 面 的 所 有 位 
都 扩展 为 1; 各 其 最 高 位 为 0， 则 最 高 位 前 面 的 所 有 位 都 扩展 为 0 。 

i 用 来 选择 第 二 个 操作 数 。i 一 0 时 ,第 二 操作 数 在 Rs; 中 ; i 二 1 时 ,第 二 操作 数 为 Smml3。 


2. 指令 的 功能 与 寻 址 方式 


1) 算术 逻辑 运算 指令 
功能 : 将 Rs 、Rss 的 内 容 ( 或 Smm13) 按 操作 码 规定 的 操作 运算 后 将 结果 送 往 R,。 
i i 二 0 dh Pm )OP(Rs;s); 当 ; 一 1 时 ,Rj 一 (Ras)OP Simml3, 
2) 取 数 / 存 数 指令 

动能 ， LOAD 指令 将 存 人 器 中 的 数据 送 往 Ra 中 ,而 STORE 指令 将 Rs 中 的 数据 送 往 丰 
储 器 中 。 

存储 器 地 址 的 计算 方法 如 下 (寄存 器 间接 寻 址 方式 ): 

当 i 二 0 时 ,存储 占 地 址 = (Rsi) 十 (Rs;s); 

当 1 二 1 时 ,存储 兹 地 址 = (Rsi) 十 Simm13。 

3) 控制 转移 类 指令 

条 件 转 移 (BRANCH): 由 Cond 字段 决定 程序 是 否 转移 ,用 相对 寻 址 方式 形成 转移 
地 址 。 

转移 并 连接 (JMPL) : 将 本 条 指令 的 地 址 (PC 值 ) 保 存在 以 Ry 为 地 址 的 寄存 器 中 以 备 
程序 返回 时 使 用 。 用 寄存 占 间 址 方式 形成 转移 地 址 ，。 

调用 (CALL): 采用 相对 寻 址 方式 形成 转移 地 址 。 

陷阱 CTRAP) : 采用 寄存 带 间 址 方式 形成 转移 地 址 ， 
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从 TRAP 程序 返回 (RETT) : 用 寄存 需 间 址 方式 形成 转移 地 址 。 

4) 读 / 写 专用 寄存 船 指令 

SPARC 有 4 个 专用 寄存 器 (PSR,Y,WIM,TBR) ,其 中 PSR 称 为 程序 状态 寄存 器 , 它 
的 内 容 反 上 映 并 控制 机 颖 的 运行 状态 ,比较 重要 ,因此 读 / 写 PSR 的 指令 一 般 是 特权 指令 

在 SPARC 中 ,有 一 些 基 本 操作 没有 选 入 指令 系统 ,但 很 容易 使 用 指令 集中 已 有 的 一 A 
指令 来 符 代 实现 。 表 3-8 左 半 部 列 出 了 6 种 基本 操作 的 功能 , 表 的 右 半 部 是 蔡 代 指令 及 
现 方法 。 因 为 SPARC 约定 R, 的 内 容 恒 为 0, 而 且 立 即 数 可 yp eri ni 
些 操作 可 以 替代 实现 . 由 此 可 体验 到 所 请“ 精简 指 令 系 统 ” 的 含义 和 用 意 。 

表 3-8 SPARC 中 的 基本 操作 替代 实现 

基本 操作 替换 指令 实现 方法 
寄存 器 间 传 送 数据 ADD R。 十 Ro 一 Rs 
寄存 器 内 容 加 1 ADD 立即 数 imml13 王 1, 作 为 操作 数 
寄存 器 内 容 减 1 SUB 立即 数 imm13== 一 1, 作 为 操作 数 

| SUB Ra<—Ro—R. 
取 反 码 XOR 立即 数 imml3 三 一 1, 作 为 操作 数 
清除 寄存 器 ADD Ru<Ro 十 Rs 


本 章 小 结 


章 主 要 讲述 了 以 下 内 容 : 

(1) 指令 系统 是 一 台 计 算 机 中 所 有 机 带 指 令 的 集合 , 它 是 表征 一 人 台 计 算 机 性 能 的 重要 
因素 ,指令 的 格式 与 功能 不 仅 直 接 影响 到 机 需 的 硬件 结构 ,而 且 也 影响 到 系统 软件 。 

(2) 指令 格式 是 指令 用 二 进 制 代 人 码 表示 的 结构 形式 , 通 第 由 操作 码 字 段 和 地 址 码 字 段 
组 成 。 操 作 码 字段 表征 指令 的 操作 特性 与 功能 ,而 地 址 码 字 段 指 示 操 作 数 的 地 址 。 目 前 多 
采用 二 地 址 . 单 地 址 、 委 地 址 混合 方式 的 指令 格式 。 指 令 字 长 度 分 为 : 单字 长 . 半 字 长 、 双 字 
长 三 种 形式 ,高 档 微 型 机 中 目前 多 采用 32 位 长 度 的 单字 长 形式 。 

(3) 寻 址 方式 包括 指令 寻 址 方式 、 数 据 寻 址 方式 。 形 成 指令 地 址 的 方式 , 称 为 指 邻 寻 址 
方式 ,有 顺序 寻 址 和 跳跃 寻 址 两 种 。 形 成 操作 数 地 址 的 方式 , 称 为 多 = 数 
放 在 专用 寄存 器 .通用 寄存 器 .内 存 和 指令 中 。 数 据 寻 址 方式 有 : 立即 寻 址 、 直接 寻 址 、 间接 
寻 址 .寄存 器 寻 址 .寄存 器 间接 寻 址 .相对 寻 址 、 基 址 寻 址 、. 变 址 寻 址 、 块 寻 址 、. 段 寻 址 等 多 种 。 
按 操 作 数 的 物理 位 置 不 同 , 有 RR 型 和 RS 型 。 前 者 比 后 者 执行 的 速度 快 。 堆 栈 是 一 种 特 
殊 的 数据 寻 址 方式 ,采用 "先进 后 出 ?原理 。 按 实现 方法 不 同 ， 分 为 便 堆 栈 和 软 堆栈 。 

(4) 不 同 机 器 有 不 同 的 指令 系统 ,一 个 较 完 善 的 指令 系统 应 当 包 含 数 据 传送 类 指令 、 算 
本 运 算 类 指令 .逻辑 运算 类 指令 .程序 控制 类 指令 .LO 类 指令 . 宁 符 串 类 指令 、 系统 控制 类 
指令 。 

(5) RISC 指令 系统 是 CISC 指令 系统 的 改进 , 它 pep eh 由 指令 条 数 少 ; 处 指 
令 长 度 固定 ,指令 格式 和 寻 址 种 类 少 ; 只 有 取 数 / 存 令 访 问 存 储 髓 ,其 余 指令 的 操作 
均 在 寄存 右 之 间 进 行 。 
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2. 操作 三 3. 操作 数 4. 指令 系统 
5. 有 效 地 址 6. 寻 址 方式 7. 指令 字 长 8. CISC 
9. RISC 
二 、 选 择 题 
指令 系统 中 采用 不 同 寻 址 方式 的 主要 目的 是 ( 
A. 实现 存储 程序 和 程序 控制 
B. 缩短 指令 长 度 ,扩大 寻 址 空间 ,提高 编程 灵活 性 
C， 可 以 直接 访问 外 存 
D. 提供 扩展 操作 码 的 可 能 并 降低 指令 译 码 难度 
2. 下 列 说 法 中 不 正确 的 是 ( ) 。 
A. 机 恬 语 言 和 汇编 语言 都 是 面向 机 器 的 ,它们 和 具体 机 器 的 指令 系统 密切 相关 
B. 指令 的 地 址 字段 指出 的 不 是 地 址 ,而 是 操作 数 本 号 ,这 种 寻 址 方式 称 为 立即 寻 址 
C. 堆栈 是 存储 右 的 一 部 分 ,也 可 以 通过 地 址 访问 
D. 机 顺 中 的 寄存 部 和 存储 单元 是 统一 编 址 的 
3. 某 计 算 机 有 16 个 通用 寄存 器 ,采用 32 位 定 长 指令 字 , 操 作 码 字段 ( 含 寻 址 方式 位 ) 
为 8 位 ,Store 指令 的 源 操作 数 和 目的 操作 数 分 别 末 用 寄存 碳 直 接 寻 址 和 基 址 寻 址 方式 ,大 
基 址 寄存 磊 可 使 用 任 一 通用 寄存 郑 , 且 偏 移 量 用 补 码 表示 , 则 Store 指令 中 仿 移 量 的 取 仁 范 
围 是 ( )。(2014 年 全 国 硕 士 研 究 生 人 学 统考 计算 机 学 科 专 业 试 题 ) 
A. 一 32 768 一 十 32 767 B. 一 32 767 一 十 32 768 
C. 65 536 一 十 65 535 D. 一 65 535 一 十 65 536 
4. 假设 变 址 寄存 器 及 的 内 容 为 1000H ,指令 中 的 形式 地 址 为 2000H; 地 址 1000H 中 
的 内 容 为 2000H, 地 址 2000H 中 的 内 容 为 3000H, 地 址 3000H 中 的 内 容 为 4000H, 则 变 址 
寻 址 方式 下 访问 到 的 操作 数 是 ( )。(2013 年 全 国 硕士 研究 生 人 学 统考 计算 机 学 科 专 业 
试题 ) 
A. 1000H B. 2000H C. 3000H D. 4000H 
5。 偏 移 寻 址 通过 将 某 个 寄存 各 内 容 与 一 个 形式 地 址 相 加 而 生成 有 效 地 址 。 下 列 寻 址 
方式 中 ,不 属于 偏 移 寻 址 方式 的 是 ( )。(2011 年 全 国人 硕士 研究 生 入 学 统考 计算 机 学 科 
专业 试题 ) 
A. 间接 寻 址 B. 基 址 寻 址 C， 相 对 寻 址 D. 变 址 寻 址 
6. 某 机 器 字 长 16 位 , 主 存 按 字 节 编 址 ,转移 指令 及 用 相对 寻 址 ,由 两 个 字 贡 组 成 ,第 一 
字 节 为 操作 码 字 段 ,第 二 字 节 为 相对 位 移 量 字段 。 假 定 取 指 令 时 ,每 取 一 个 字 节 PC 自动 
加 1。 知 某 转 移 指 令 所 在 主 存 地 址 为 2000H, 相 对 位 移 量 字段 的 内 容 为 06H, 则 该 转移 指 
令 成 功 转移 以 后 的 目标 地 址 是 ( )。(2009 年 全 国 硕 士 研 究 生 人 学 统考 计算 机 学 科 专 
业 试 题 ) 
A. 2006H B. 2007H C. 2008H D. 2009H 
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7. 下 列 关 于 RISC 的 叙述 中 ,错误 的 是 ( )。(2009 年 全 国 硕 士 研究 生 人 学 统考 计 
算 机 学 科 专 业 试题 ) 
A. RISC 普遍 采用 微 程 序 控 制 肯 
B. RISC 大 多 数 指 令 在 一 个 时 钟 周期 内 完成 
C. RISC 的 内 部 通用 寄存 各 数量 相对 CISC 多 
D，RISC 的 指令 数 、 寻 址 方式 和 指令 格式 种 类 相对 CISC 少 
、 综 合 题 
一 个 机 器 的 指令 系统 通常 应 满足 哪 几 方面 的 要 求 ? 
. 常用 机 器 指令 格式 有 哪些 ? 
. 指令 操作 码 主 要 有 哪 两 种 编码 格式 ? 
. 指令 操作 通常 分 哪 几 类 ? 
. 如何 减少 一 条 指令 中 给 出 的 地 址 数 ?” 又 如 何 减少 指令 中 表示 一 个 地 址 码 的 位 数 ? 
一 人 台 机 器 的 指令 系统 为 什么 要 提供 多 种 寻 址 方式 ? 
.什么 是 立即 数 寻 址 ? 立即 数 寻 址 中 的 “立即 数 ” 一 般 存 放 在 哪里 ? 
. 人 和 位 述 相对 寻 址 、 变 址 寻 址 及 基 址 寻 址 的 原理 ,这 三 种 寻 址 方式 有 哪些 相同 点 和 不 


可 
汕 
DO 


. RN 
. 设 某 指令 系统 指令 定 长 12 位 ,每 个 地 址 段 3 位 , 试 设计 一 种 方案 ,使 该 指令 系统 有 
4 条 二 二 令 ,8 条 二 地 址 指令 ,180 条 单 地 址 指令 。 
11. 假设 某 计算 机 指令 令 长 度 为 20 位 ,具有 双 操 作 数 、 单 操作 数 、 无 操作 数 三 类 指令 
格 云 ， 每 个 操作 数 地 址 规定 用 b 位 表示 , 现 已 设计 出 mi 条 双 操 作 数 指令 wn 条 无 操作 数 
指令 。 
(1) 奢 玉 用 定 长 8 位 操作 码 宇 段 , 则 这 人 台 计 算 机 最 多 可 以 设计 出 多 少 条 单 操作 数 指令 ? 
(2) 右 操 作 码 字段 长 度 不 固定 , 则 这 全 计算 机 最 多 可 以 设计 出 多 少 条 单 操作 数 指令 ? 
12. 某 微型 机 指令 格式 如 图 3-26 所 示 ，。 


图 3-26 ”微型 机 指令 格式 


格式 中 D 为 位 移 量 ,X 为 寻 址 方式 特征 值 : 

X 一 00, 直接 寻 址 ; 

X 一 01, 用 变 址 寄存 带 Ri 进行 变 址 ; 

X 一 10, 用 变 址 寄存 熏 Rs 进行 变 址 ; 

X 一 11， 相对 寻 址 。 

设 (PC) 王 1234H,(CR;,) 王 0037H,(R: ) 王 1122H,(CH 代表 十 六 进 制 数 ) ,请 确定 以 下 指 
令 的 有 效 地 址 : (1)4420H; (2)2244H; (3)1322H; (4)3521H; (5)6723H。 

13. 某 指 令 系 统 指 令 定 长 16 位 ,指令 格式 如 图 3-27 所 示 , 试 分 析 指 令 格 式 及 寻 址 方式 
的 特点 。 
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Il2 1]1 


| HR | | WR | 


. 一 种 单 地 址 指令 格式 如 图 3-28 所 示 , 其 中 I 为 间接 特征 ,X 为 寻 址 模式 ,DD 为 形式 
Re 1.X.D 组 成 该 指令 的 操作 数 有 效 地 址 EA。 设 R 为 变 址 寄存 器 , Ri 为 基 址 寄存 器， 
PC 为 程序 计数 器 ,请 在 表 3-9 中 第 一 列 位 置 填 人 适当 的 寻 址 方式 名 称 。 


op TI xD 
图 3-28 指令 格式 2 


表 3-9 填 入 寻 址 方式 


寻 址 方式 名 称 I XX 有 效 地 址 EA 
(1) 0 00 EA=D 
(2) 0 01 EA= (PC)+TD 
(3) 0 10 EA=(R)TD 
(4) 0 11 EA= (KR ) 
(5) 1 00 EA=(D) 
(6) 1 11 EA=((R)+TD),D=0 


15. 一 个 处 理 器 具有 如 图 3-29 所 示 的 指令 格式 。 


6 人 7 2 全 3 位 3 位 


泊 宁 存 器 旧 标 寄存 


图 3-29 指令 格式 3 


其 格式 表明 有 8 个 通用 寄存 器 (长 度 16 位 ),X 为 指定 的 寻 址 模式 , 主 存 最 大 容量 为 
256KB。 

(1) 假设 不 用 通用 寄存 此 也 能 直接 访问 主 存 的 每 一 个 操作 数 
位 ,请 问 地 址 码 域 应 该 分 配 多 少 位 ? 指令 字 长 度 应 有 多 少 位 ? 

(2) 假设 X= 二 11 时 ,指定 的 那个 通用 寄存 器用 作 基 址 寄存 需 , 请 提出 一 个 硬件 设计 规 
则 ,使 得 被 指定 的 通用 寄存 器 能 访问 1MB 主 存 空 间 中 的 每 一 个 单元 。 

16. (2013 年 全 国 硕士 研究 生 人 学 统考 计算 机 学 科 专 业 试 题 ) 某 计算 机 采用 16 位 定 长 
指令 字 格 式 , 其 CPU 中 有 一 个 标志 寄存 天 ,其 中 包含 进位 / 依 位 标志 CE、 雪 标志 ZF 和 符号 
标志 NE。 假 定 为 该 机 设计 了 条 件 转移 指令 ,其 格式 如 图 3-30 所 示 。 


] 3 11 10 0 ke i 0 


到 3-30 指令 格式 4 


;并 假设 操作 码 域 OP 一 6 


其 中 ,00000 为 操作 码 OP; C.Z 和 NN 分 别 为 CF、ZF 和 NF 的 对 应 检测 位 , 某 检测 位 
为 1 时 表示 需 检 测 对 应 标志 , 需 检 测 的 标志 位 中 只 要 有 一 个 为 1 就 转移 ,否则 不 转移 ,大 
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C 二 1,Z 二 0,N 二 1, 则 需 检测 CF 和 NF 的 值 , 当 CF 二 1 或 NF 二 1 时 发 生 转 移 ; OFFSET 是 
相对 偏 移 量 , 用 补 人 码 表 示 。 转 移 执 行 时 ,转移 目标 地 址 为 (PC) 十 2 十 2XOFFSET; 顺序 执行 
时 ,下 条 指令 地 址 为 (PC) 十 2。 请 回答 下 列 问题 。 
(1) 该 计算 机 存储 熏 按 字 广 编 址 还 是 按 字 编 址 ? 该 条 件 转移 指令 同 后 (反问 ) 最 多 可 跳 
转 多 少 条 指令 ? 
(2) 某 条 件 转 移 指 令 的 地 址 为 200CH ,指令 内 容 如 图 3-31 所 示 , 硅 该 指令 执行 时 CF 
0,ZF 一 0,NF 二 1, 则 该 指令 执行 后 PC 的 值 是 多 少 ? yy Cr=1,4F=0,Nr = 
0, 则 该 指令 执行 后 PC 的 值 又 是 多 少 ? 请 给 出 计算 过 


15 Il1 10 9 8 7 0 
00000 0 11100011 


图 3-31 指令 格式 5 


(3) 实现 “无 符号 数 比 较 小 于 等 于 时 转移 ”功能 的 指令 中 ,C.Z 和 NN 应 各 是 什么 
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现代 计算 机 主要 采用 冯 。 诺 依 曼 结构 设计 ,这 种 计算 机 的 特点 是 采用 存储 程序 的 思想 ， 
即将 要 运行 的 程序 事先 存放 在 存储 器 中 ,由 CPU 从 存储 器 中 取出 来 并 执行 。 存储 器 的 性 
能 在 很 大 程度 上 影响 到 机 器 的 整体 性 能 

本 章 首先 介绍 存储 器 的 组 织 、 分 类 和 分 层 结 结构 ,然后 介绍 计算 机 主 存储 器 的 组 成 与 工作 
原理 ,最 后 介绍 提高 存储 系统 性 能 的 交叉 存储 技术 ,高 速 缓冲 存储 器 及 虚拟 存储 器 技术 。 


4.1 存储 系统 概述 


本 节 首 先 让 大 家 认识 一 下 存储 器 的 逻辑 组 织 及 CPU 是 如 何 对 其 进行 操作 和 访问 的 ， 
然后 介绍 计算 机 中 都 有 哪些 种 类 的 存储 右 ,最 后 介绍 现代 计算 机 普遍 采用 的 存储 层次 。 


4.1.1 存储 怖 的 组 织 


从 物理 上 讲 , 存 储 器 是 由 具有 一 定 记 忆 功 能 的 物理 器 件 构成 的 。 在 不 同 历 史 阶 段 , 随 着 
存储 技术 的 发 展 ,计算 机 中 采用 了 不 同 的 物理 颖 件 构 成 其 存储 髓 ,如 20 世纪 60 一 70 年 代 计 
算 机 中 采用 磁 世 存储 器 作为 计算 机 的 主 存 ,而 目前 计算 机 主 存 则 普遍 采用 的 是 半导体 存储 
句 件 。 无 论 采 用 什么 样 的 存储 器 件 , 从 人 逻辑 上 讲 , 存 储 器 可 以 看 成 由 一 个 个 存储 单元 构成 的 
连 组 的 地 址 空间 。 

如 图 4-1 所 示 是 存储 豆 的 逻辑 组 织 结 构图 。 该 存储 器 共 vonop 
有 2”(1MD) 个 存储 单元 ,每 个 存储 单元 能 存储 8 位 二 进 制 数 00001H 
据 。 每 个 单元 都 有 一 个 20 位 的 二 进 制 存储 单元 地 址 (图 4-1 00002H 
中 采用 十 六 进 制 表示 ), 且 相 邻 单元 的 地 址 是 连续 递增 的 , 即 
自 上 而 下 ,从 最 低地 址 00000H 开始 连续 递增 到 最 高 地 址 
FFFFFH。 每 个 单元 中 存放 的 数据 称 为 该 单元 的 内 容 。 例 FFFFFH 
如 ,00000H 单元 的 内 容 为 30,00001H 单元 的 内 容 为 50。 图 4-1 存储 器 的 逻辑 组 织 

计算 机 CPU 对 存储 问 的 操作 主要 有 两 种 : 一 是 读 , 二 是 
写 。 所 谓 “ 谈 ”, 是 指 CPU 将 菜 个 指定 的 存储 单元 的 内 容 从 存储 天 中 取出 , 送 入 CPU 或 其 
他 部 件 中 处 理 ; 所 谓 " 写 ,是 指 CPU 将 其 他 某 个 部 件 中 的 数据 写 人 指定 的 存储 单元 。CPU 
对 存储 天 的 读 操 作 .与 操作 统称 为 CPU 访 存 操作 。 

般 来 讲 ,CPU 与 存储 髓 之 间 的 物理 连接 主要 包括 三 组 信号 线 : 地 址 线 、 数 据 线 和 控 
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制 线 ,如 图 4-2 所 示 。 


地 址 线 


仔 刁 蔡 


READ 


WRIIE 


图 4-2 CPU 与 存储 器 的 连接 


其 中 ,AR 是 地 址 寄存 右 , 用 于 存放 CPU 要 访问 的 存储 单元 的 地 址 ,CPU 对 存储 需 的 
访问 无 论 是 读 还 是 写 , 部 自 先 要 将 要 访问 的 存储 单元 的 地 址 送 入 AR 中 ; DR 是 数据 寄存 
俯 , 用 于 存放 CPU 与 存储 右 之 则 交换 的 数据 。READ 和 WRITE 分 别 是 CPU 用 于 对 存储 
做 进行 读 或 写 的 控制 信号 。CPU 对 存储 带 进 行 读 操 作 时 , 须 给 出 READ 控制 信号 ; 进行 写 
操作 时 , 须 给 出 WRITE 信号。 


CPU 对 存储 天 的 谈 操 作 过 程 如 下 : 
要 访问 的 存储 单元 地 址 一 AR 


AR 内 容 送 地 址 总 线 
CPU 发 出 读 命令 READ 


存储 单元 内 容 读 出 至 数据 总 线 


数据 总 线 一 DR 
CPU 对 存储 大 的 写 操作 过 程 如 下 : 


存储 单元 地 址 一 AR 
AR 内 容 送 地 址 总 线 


DR 内 容 送 数据 总 线 


发 出 写 命令 WRITE 
DR 中 的 内 容 写 人 存储 单元 
4.1.2 存储 兹 的 分 类 


在 计算 机 发 展 的 不 同 阶 段 , 人 们 设计 出 了 不 同 种 类 的 存储 器 ,如 从 最 初 的 和 延迟 线 到 磁 
心 存 储 胡 ,上 骨 到 今天 的 半导体 存储 兹 ,一 方面 是 为 了 满足 计算 机 技术 发 展 的 需要 。 万 一 方面 
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也 是 与 当时 的 般 件 技术 及 制作 工艺 水 平 相 适应 。 

现代 计算 机 存储 硕 种 类 埃 多 ,之 所 以 这 样 ,是 因为 不 同 种 类 的 存储 天 可 以 满足 不 同 应 用 
9 需要。 从 不 同 角度 进行 划分 ,会 有 不 同 种 类 的 存储 从 。 

按照 存储 冀 在 计算 机 中 的 作用 划分 ,主要 包括 计算 机 主 存 ,计算 机 辅 存 和 高 速 缆 存 。 主 
仓 (Memory) 又 称 为 计算 机 内 存 , 就 是 汉 ， 请 曼 结构 中 的 存储 冀 , 用 于 存储 要 执行 的 程 厅 
和 处 理 的 数据 ; 辅 存 (Storage) 又 称 为 计算 机 外 存 , 在 现代 冯 “。 诺 依 曼 机 需 中 ,程序 在 执行 
之 前 是 以 文件 的 方式 存储 在 外 存 中 的 , 当 要 运行 某 程序 时 ,由 操作 系统 将 该 程序 从 外 存 调 人 
内 存 中 ; 高 速 缓存 (cache) 是 一 种 小 容量 、 高 速度 的 存储 器 ,目前 ,在 计算 机 的 主板 和 CPU 
中 均 设 置 了 高 速 缓存 ,设置 高 速 缓存 的 目的 是 利用 程序 的 局 部 性 原理 实现 计算 机 的 存储 必 
次 ,提高 CPU 的 访 存 速度 ,以 匹配 CPU 和 主 存 之 间 在 速度 上 的 差异 。 有 关 高 速 缓 存 的 内 
容 将 在 4. 4 节 详 细 讲 述 。 

按照 存储 需 所 使 用 的 物理 存储 介质 或 材料 划分 ,目前 主流 的 存储 需 主 要 有 三 种 : 一 是 
半导体 存储 器 , 它 是 用 半导体 材料 制作 成 的 存储 器 ,通常 是 以 存储 器 芯片 的 形式 出 现 的 , 随 
者 集成 度 的 提交 ,单个 存储 帮 心 片 的 容量 越 来 越 大 ; 二 是 磁 介 质 存 储 带 ,使 用 聚 酯 塑料 或 金 
属 溥 片 为 基质 ,在 其 表面 涂 上 磁性 材料 ,有 来 用 磁 记 录 原 理 存 储 信 息 , 目 前 主流 磁 介 质 存 储 融 
主要 有 软盘 存储 器 ,硬盘 存储 器 和 磁带 存储 器 等 ; 三 是 光 存 储 器 , 按 光 存储 和 读 写 原理 制作 
成 的 存储 天 ,如 CD-ROM 和 可 读 写 光盘 等 。 半 导体 存储 甫 与 磁 介 质 存 储 枯 和光 存储 大 相 
比较 ,速度 快 ,集成 度 高 ,价格 也 较 高 。 在 现代 计算 机 中 ,半导体 存储 天 主要 用 作 计 算 机 的 主 
存 , 而 磁 介 质 存 储 般 和 光 存 储 天 则 用 作 计 算 机 辅 存 。 

按照 存储 善 的 该 写 功 能 划分 ,主要 有 两 种 : 一 是 随机 存 取 存 
储 盎 (Random Access Memorvy,RAM) ,可 以 对 存储 单元 按 地 址 
用 户 程序 随机 存 取 ; 二 是 只 读 存 储 盎 (Read Only Memorvy,ROM) ,在 正常 

至 工作 条 件 下 ,对 单元 内 容 只 可 读 不 可 写 。 这 两 类 存储 器 均 属于 半 

导体 存储 着 ,是 构成 计算 机 主 存 的 主要 存储 介质 ,而 其 中 人 AM 
在 计算 机 中 用 于 存储 操作 系统 的 常 驻 内 存 部 分 和 用 户 程 序 ， 
操作 系统 ROM 则 用 于 存储 操作 系统 的 内 核 。 计算机 内 存 分 布 如 图 4-3 
第 驻 内 存 所 示 
除 上 述 分 类 外 ,存储 闪 还 有 易 失 性 和 非 钨 失 性 之 分 。 所 博多 


RAIM 


末 作 系统 | | i | 
ROM 1 | “风度 ”| 失 性 是 指 写 人 存储 器 中 的 内 容 在 通电 情况 下 能 够 保存 ,一 掉 电 见 


全 部 丢失 ; 非 匈 失 性 则 是 指 写 人 存储 本 中 的 内 容 在 不 通电 的 情 


图 4-3 计算 机 内 存 分 布 况 下 仍然 能 够 保存 。 上 述 磁 介质 存储 硕 、 光 存储 天 和 半导体 存储 
售 中 的 ROM 均 属 于 非 钨 失 性 存储 天 ,而 人 AM 则 属于 多 失 性 存 
储 舌 。 人 们 可 能 都 遇 到 过 这 梓 一 种 情况 , 当 使 用 字 处 理 软件 进行 一 个 文本 编辑 时 ,突然 俘 电 
了 ,每 再 来 电 时 ,发 现 先前 编辑 输入 的 内 容 中 ,未 保存 的 部 分 不 见 了 。 其 实 , 当 新 建 一 个 文件 
并 利用 字 处 理 软件 编辑 文本 时 , 字 处 理 系 统 会 为 用 户 编 辑 的 文件 在 内 存 (RAM 部 分 ) 开 辟 
一 个 缓冲 区 。 每 当 保 存 文件 时 , 字 处 理 系 统 就 会 将 缓冲 区 中 的 内 容 写 人 外 存 的 文件 中 ,这 时 
即使 机 带 抒 电 , 保 存在 外 存 文 件 中 的 内 容 仍 然 保 留 厦 ,因为 外 存 是 由 非 多 失 性 存储 带 构 成 
的 。 而 如 果 设 有 保存 ,这 时 机 器 掉 电 , 则 缓冲 区 中 的 内 容 将 全 部 丢失 。 
将 以 上 类 型 的 存储 右 总 结 如 图 4-4 所 示 。 
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| 汗 机 存 取 存 储 右 (RAM) 
“1 只 读 存储 器 (ROMD) 

计算 机 存储 器 | 

| Ls 磁 介 质 存 储 器 : 磁盘 .磁带 等 

个 项 全 CD-ROM . 读 写 光 盘 等 

图 4-4 计算 机 存储 器 种 类 


在 第 4 章 , 主 要 讲述 构成 计算 机 主 存 储 郑 的 半导体 存储 关 , 介 绍 半导体 存储 需 的 种 类 、 
单元 电路 的 构成 及 工作 原理 和 主 存 系统 的 设计 等 。 磁 介质 存储 上 右 和 光 存 储 占 等 辅助 存储 鼎 
(以 下 简称 辅 存 ) 的 内 容 放 在 后 面 章节 讲述 。 在 计算 机 中 ,操作 系统 是 将 辅 存 作为 设备 来 进 
行 管理 的 。 


4.1.3 存储 兹 的 分 层 结 构 


CPU 执行 指令 的 过 程 实际 上 分 为 两 个 步骤 : 一 是 取 指 令 , 二 是 执行 指令 。CPU 与 存储 
能 之 间 是 通过 总 线 连 接 的 , 当 CPU 执行 一 条 指令 时 ,首先 必须 从 存储 需 中 将 指令 读 出 到 总 
线 上 ,再 通过 总 线 将 指令 传送 到 CPU 内 部 ,这 一 过 程 称 为 取 指 令 ; 然后 对 指令 进行 译 码 分 
析 ,最 后 执行 该 指令 ,这 一 过 程 称 为 执行 指令 ,如 图 4-5 所 示 。 


存 情 苗 


指令 从 和 存储 和 项 中 读 出 


指令 在 总 线 上 传输 
ml ee 


取 指 令 执行 指令 


图 4-5 ”指令 的 执行 过 程 


假设 指令 从 存储 需 中 该 出 的 时 间 为 i ,指令 在 总 线 上 传输 的 时 间 为 ts ,指令 在 CPU 中 
执行 的 时 间 为 i 。 这 样 ,一 条 指令 的 执行 时 间 为 ia 十 ts 十 te , 称 为 指令 周期 。 zip 的 大 小 取决 
于 总 线 传输 速度 ,而 坟 的 大 小 取决 于 所 配置 的 存储 絮 的 存 取 速度 ,这 一 时 间 实 际 上 就 是 存 
储 屁 的 读 周 期 时 间 , 对 某 一 存储 器 而 言 ,这 一 时 间 是 固定 的 。 由 此 可 以 看 出 ,计算 机 的 性 能 
是 由 组 成 它 的 各 个 功能 部 件 的 综合 性 能 来 体现 的 , 光 有 高 速 的 CPU 还 不 够 ,还 要 有 高 速 的 
存储 人 和 高 速 的 总 线 传输 等 。 

因此 , 当 用 户 在 配置 一 台 计 算 机 时 ,对 机 器 的 存储 器 总 是 希望 其 容量 越 大 越 好 ,速度 越 
快 越 好 ,同时 还 希望 价格 越 便 宜 越 好 。 但 性 能 和 价格 却 往 往 是 一 对 相互 矛盾 的 因素 ,性 能 高 
往往 意味 着 价格 高 。 当 用 户 为 了 某 种 应 用 而 不 惜 代价 时 ,可 以 为 机 器 配置 大 容量 高 速 存储 
佑 。 但 作为 面向 一 般 用 户 的 通用 计算 机 ,这 样 做 则 会 令 用 户 在 其 面前 望而却步 。 那 么 是 否 
有 什么 办 法 可 以 让 用 户 做 到 用 较 低 的 价格 配置 到 高 速 大 容量 的 存储 右 呢 ? 用 户 的 需 要 就 是 
计算 机 设计 者 努力 的 方向 ,现代 计算 机 存储 器 普遍 采用 如 图 4-6 所 示 的 层次 结构 来 实现 上 
述 目标 。 
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容量 ”速度 ”价格 


主 存 小 快 局 


cache 


cache- 主 存 层 哆 : 


主 存 
辅 存 


大 慢 低 
主 存 - 畏 仓 层 雇 


图 4-6 存储 层次 


存储 器 的 层次 包括 高 速 缓冲 存储 器 (cache) 、 主 存 和 辅 存 ,其 中 ,cache 是 由 小 容量 (通常 
为 几 十 KB 到 几 十 MB) .高 速 的 半导体 存储 器 件 构成 的 ,当然 这 种 器 件 的 价格 也 相对 较 高 ， 
主 存 一 般 使 用 动态 半导体 存储 器 件 构成 ,在 速度 上 比 cache 慢 ,但 容量 更 大 ,价格 相对 更 低 ， 
现代 机 王 根 据 应 用 要 求 的 不 同 通 第 将 主 存 配置 到 几 上 日 MB 至 几 个 GB, 一 些 对 内 存 要 求 很 
高 的 场合 可 配置 到 几 十 GB 甚至 更 大 ; 辅 存 又 称 海量 存储 天 ,通常 由 磁 介 质 存 储 需 构成 ,其 
特点 是 容量 大 ,速度 慢 ,价格 便宜 。cache 又 可 以 进一步 分 为 片上 cache 和 板 上 cache。 片 上 
cache 是 指 CPU 内 部 配置 的 cache, 又 称 为 一 级 cache, 板 上 cache 是 指 计 算 机 主板 上 配置 的 
cache ,又 称 为 二 级 cache。 一 级 cache 比 二 级 cache 的 容量 更 小 ,但 速度 更 快 。 在 有 些 机 天 
中 ,还 进一步 将 指令 和 数据 分 开 , 分 别人 存放 在 指令 缓存 和 效 据 缓 存 中 。 

存储 如 的 这 种 分 层 结构 将 为 用 户 的 程序 提供 一 个 在 容量 方面 相当 于 辅 存 容量 ,而 在 
CPU 的 访问 速度 方面 则 接近 于 访问 cache 的 速度 的 存储 空间 。 如 何 能 做 到 这 一 点 ,本 书 将 
分 别 在 4.4 节 和 4. 5 节 进 一 步 讲 解 。 


4.2 半导体 存储 器 


半导体 存储 器 是 目前 构成 计算 机 主 存储 器 的 主要 存储 介质 。 本 节 首 先 介绍 半导体 存储 
器 的 种 类 ,然后 介绍 几 种 半导体 存储 器 的 单元 电路 的 组 成 及 工作 原理 ,最 后 介绍 如 何 设计 计 
算 机 的 主 存储 器 。 


4.2.1 半导体 存储 强 的 种 类 


计算 机 从 所 运行 的 程序 种 类 上 讲 , 主 要 分 为 操作 系统 程序 和 其 他 应 用 程序 。 操 作 系 统 
是 整个 机 器 系统 的 软件 核心 ,从 构成 上 讲 , 它 主要 包括 操作 系统 内 核 (Core) 和 操作 系统 的 外 
过 (Shell) ,其 中 ,内核 起 着 引导 机 需 系 统 局 动 和 为 应 用 程序 提供 输入 输出 服务 和 管理 的 作 
用 (例如 ,DOS 操作 系统 的 基本 输入 输出 系统 BIOS)。 由 于 操作 系统 内 核 无 论 机 骨 是 否 通 
电 都 必须 永久 保存 ,因此 在 机 融 中 通 第 使 用 非 多 失 性 存储 天 ROM 存储 ,而 操作 系统 的 外 元 
和 其 他 应 用 程序 均 可 存储 在 易 失 性 存储 器 RAM 中 ,其 中 操作 系统 的 外 过 是 操作 系统 常 驻 
内 存 部 分 , 通 第 是 在 机 顺 司 动 时 从 辅 存 中 调 人 内 存 中 的 ,而 用 户 程序 是 在 运行 时 由 操作 系统 
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调 人 内存 中 的 。 

随机 存 取 存 储 央 (CRAM) 按 构成 其 单元 电路 的 不 同 ,又 分 为 静态 随机 存 取 存储 天 
(SRAM) 和 动态 随机 存 取 存储 髓 CDRAM)。 这 两 种 存储 器 相 比 较 而 言 ,SRAM 速度 更 
快 , 但 片 容 量 小 ,价格 更 贵 , 因 此 SRAM 主要 用 作 计 算 机 的 cache, 而 DRAM 则 用 作 计 算 机 

只 谈 存 储 天 ROM 种 类 较 多 ,主要 包括 传统 的 掩 膜 式 ROM、 一 次 可 编程 式 ROM 
(PROM). 线 可 擦 除 可 编程 式 ROM (UVEPROM) 和 电 可 擦 除 可 编程 式 ROM 
(EPROM)。 前 三 种 ROM 在 正常 工作 条 件 下 只 可 读 不 可 写 , 是 真正 意义 上 的 只 读 存 储 髓 ， 
而 EPROM we 上 可 读 可 写 ,但 与 RAM 相 比 较 , 最 大 的 不 同 是 : 它们 均 是 非 匈 失 性 的 。 

措 膜 式 ROM 是 一 种 定制 式 ROM, 生 产 厂 家 根据 用 户 的 需要 专门 制作 掩 膜 版 ,将 用 户 
提交 的 程序 或 数据 固定 制作 在 芯片 上 。 这 种 芯片 的 特点 是 ,一旦 制作 好 ,芯片 中 的 内 容 就 无 
法 进行 修改 。 因 此 ,这 种 芯片 主要 用 于 用 户 需 大 批量 生产 具有 固定 功能 的 RONM 的 场合 使 
用 ,如 在 工业 控制 .家 用 电 顺 等 中 均 有 应 用 。 手 膜 式 ROM 的 优点 是 当 用 户 大 批量 生产 时 成 
本 相对 较 低 ,但 缺点 是 使 用 不 够 灵活 ,内容 的 写 人 需 提 交 厂 家 完成 ,而 且 用 户 需 要 大 量 订 购 
才能 使 成 本 降低 。 

一 次 可 编程 式 PROM(Programmable ROM) 顾 名 思 义 是 这 种 存储 此 可 以 进行 一 次 写 
人 或 编程 。 PROM 出 三 时 是 空 片 , 心 片 的 内 容 为 全 0 或 全 1, 用 户 可 以 根据 日 己 的 需要 将 编 
制 好 的 程序 或 数据 一 次 写 入 ,一 旦 写 入 内 容 就 无 法 再 进行 修改 。PROM 相对 掩 膜 式 ROM 
来 说 ,使 用 更 加 灵活 ,用 户 可 以 根据 自己 的 需要 批量 购买 ,也 可 以 只 购买 几 片 。 

紫外 线 可 擦 除 可 编程 式 (UV Erasable Programmable ROM,UVEPROM) 是 一 种 可 重 
复 改 写 的 ROM, 当 用 户 要 对 心 片 中 的 内 容 进 行 修改 或 重 写 时 , 需 自 先 使 用 坚 外 线 对 局 片 的 
探 除 窗 口 进行 照 冉 ( 一 般 可 放置 在 专门 的 繁 外 线 光 源 下 照 喘 ) ,经 过 一 段 时 间 后 , 心 片 中 的 内 

部 被 探 除 ,成 为 空 片 ,然后 使 用 专门 的 编程 项 ,将 新 的 内 容 写 人 世 片 中 。 由 于 太阳 光 中 
存在 紫外 线 , 因 此 ,这 种 芯片 在 使 用 中 应 注意 避免 阳光 的 照射 ,通常 的 做 法 是 用 黑色 的 胶 纸 

于 窗口 贴 起 来 。UVEPROM 由 于 其 使 用 的 灵活 性 ,应 用 较为 广汉 ,例如 , 早 些 年 
微型 计算 机 主板 上 的 用 于 存储 操作 系统 内 核 的 ROM 和 计算 机 网 卡 上 用 于 无 盘 引 导 的 
ROM 芯片 均 使 用 了 UVEPROM。UVEPROM 的 外 观 如 图 4-7 所 示 。 


FE ~ 
- mm 有 
有 
马 有 


图 4-7 UVEPROM 和 编程 器 

电 可 探 除 可 编程 式 (Electronic Erasable Programmable ROM,E*PROM) 也 属于 可 重复 
改写 的 ROM。 虽 然 UVEPROM 相对 PROM 来 说 ,可 以 多 次 改写 ,但 其 改写 的 条 件 却 比较 
特殊 ,一 般 需 要 将 其 从 工作 的 电路 板 上 拔 下 来 ,使 用 专门 的 设备 进行 改写 操作 ,这 一 方面 一 


N09p。 计算 机 组 织 与 结构 


般 的 用 户 无 法 做 到 ,为 一 方面 在 有 些 应 用 场合 ,需要 对 心 片 进行 在 线 改 瑟 。 电 可 擦 除 可 编程 
式 (E PROM) 就 是 为 满足 这 种 应 用 而 设计 的 ,对 EPROM 可 以 像 对 RAM 一 样 随机 读 写 。 
因此 ,在 使 用 上 ,FE*PROM 更 加 灵活 和 方便 ,其 在 计算 机 中 的 应 用 也 更 加 广 沁 ,如 现代 计算 
机 主板 上 和 计算 机 网 卡 上 用 于 保存 系统 设置 参数 的 存储 器 就 是 使 用 了 EEPROM。 
半导体 存储 天 的 种 类 总 结 如 图 4-8 所 示 。 
静态 RAM 
半导体 RAM| 
动态 RAM 
半导体 存储 器 掩 膜 式 ROM 
号 RON 一 次 可 编程 式 PROM 
紫外 线 可 擦 除 可 编程 式 (UVEPROM) 
电 可 擦 除 可 编程 式 (E? PROM) 


图 4-8 ”半导体 存储 器 种 类 


4.2.2 半导体 存储 届 的 组 成 与 工作 原理 
1. 静态 RAM 的 组 成 及 工作 原理 


半导体 存储 器 是 由 一 个 个 位 单元 电路 组 成 ,每 个 位 单元 电路 存储 一 位 二 进 制 信 息 。 吏 
态 RAM 的 位 单元 电路 使 用 由 三 极 管 构 成 的 触发 大 组 成 ,利用 触发 医 的 状态 存储 0、1 信息 。 
如 图 4-9 所 示 是 一 个 MOS 型 六 管 静态 RAM 单元 电路 的 构成 图 ， 


9 四 源 Fcc 


Is 16 


位 线 D 字 选 线 W 位 线 D 


图 4-9 六 管 静态 RAM 单元 电路 


图 4-9 中 ,Tl1、T2 为 存储 管 , 任 何 时 候 , 只 要 单元 电路 通电 ,T1.、T2 总 是 处 于 两 种 状态 
之 一 : Tl 导 通 、T2 截止 或 Tl 截止 ,T2 导 通 ,正好 可 以 利用 这 两 种 状态 存储 “1? 或 “0?”。 
T3、T4 为 负载 管 , 分 别 起 着 Tl1、T2 的 极 电 阻 的 作用 。T5、T6 为 控制 管 , 起 着 控制 位 单元 与 
外 界 的 接 通 和 断 开 的 作用 。 

假设 定义 : Tl 导 通 、T2 截止 时 为 存储 了 "1”; Tl 截止 `.T2 导 通 时 为 存储 了 “0”, 则 其 保 
持 、. 读 出 和 写 人 的 工作 原理 如 下 : 

保持 : 字 选 线 W 为 低 电 平 , 则 T5、T6 


起 止 ,使 得 Tl1、T2 与 外 界 电路 切断 ,它们 的 状 
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态 保 持 不 变 , 从 而 所 存储 的 信息 能 保持 。 
写 和 人, 字 选 线 W 为 高 电 平 , 则 T5、T6 管 。 厂 欲 瑟 人 “0”, 则 在 T5、T6 管 的 位 线 上 
分 别 加 上 高 、 低 电位 ,A、B 二 的 王位 半分 别 忆 训 低 电 位 ,A 点 的 高 电位 使 T2 导 通 ,B 点 
的 低 电 位 使 Tl1 截止 ,此 即 为 "07 状态 ; 知 欲 六 T5、T6 管 的 位 线 上 分 别 加 上 低 、 
高 电位 ,从 而 使 Tl 导 通 .T2 截止 ,此 即 为 "1 状态 。 
读 出 ; 字 选 线 W 为 高 电 平 , 则 T5、T6 管 导 通 . 右 原 来 存储 的 是 “0”, 则 A 点 为 高 电位 ， 
A 经 T6 产生 一 个 电流 通路 , 即 在 T6 位 线 上 可 检测 到 电流 ,如 此 读 出 了 “0”; 若 原 来 存储 的 
是 “1”, 则 B 点 为 高 电位 ,B 经 T5 产生 一 个 电流 通路 , 即 在 T5 位 线 上 可 检测 到 电流 ,如 此 读 
出 了 “1”。 
以 上 位 单元 是 构成 静态 RAM 的 基础 。 首 先 由 一 个 个 位 单元 组 合 在 一 起 构成 一 个 位 单 
元 阵列 ,再 加 上 用 于 选择 位 单元 的 译 码 电路 和 读 写 控制 等 外 围 电路 ,最 后 进行 封装 , 便 构成 


一 个 静态 RAM 世 片 。 如 图 4-10 所 示 是 一 个 静态 RAM 芯片 的 组 成 结构 图 。 


~ |/O 


列 地 址 


图 4-10 ”项 态 RAM 组 成 结构 图 


位 单元 阵列 通常 排列 成 二 维和 矩阵 的 形式 ,对 位 单元 访问 的 地 址 分 成 行 地 址 和 列 地 址 两 
部 分 , 行 、 列 地 址 分 别 通 过 行 、 列 译 码 器 产生 行 选 信 号 和 列 选 信 号 ,选中 相应 的 位 单元 , 读 / 写 
信号 控制 对 所 选中 单元 的 读 / 写 操作 。 


2. 动态 RAM 的 组 成 及 工作 原理 


动态 RAM 的 位 单元 电路 与 静态 RAM 相 比 有 很 大 的 不 同 , 静 态 RAM 的 位 单元 电路 
是 依靠 由 三 极 管 构成 的 触发 器 的 状态 来 存储 0、1 信息 的 ,而 动态 人 AM 的 位 单元 电路 则 是 
依 靠 三 极 管 上 的 极 电容 的 电 和 谷 的 有 无 来 存储 0、1 信息 的 。 如 
图 4-11 所 示 是 一 个 单 管 动态 RAM 位 单元 电路 。 ”于 远 线 W 

图 4-11 中 ,MOS 型 串 体 管 工 的 栅 极 和 油 极 分 别 连接 字 选 T 
线 W 和 位 线 DD, 而 源 极 上 则 制作 了 一 个 电容 C。 该 位 单元 电 
路 正 是 依靠 电容 C 上 电荷 的 状态 来 存储 0、1 信息 的 。 由 于 电 | 
容 能 存储 一 定 范 围 内 的 任何 电 人 向 值 , 为 此 需 设 置 一 个 国 值 ,以 
确定 高 于 某国 值 时 为 满 电 和 倚 状态 ,存储 的 是 "1”, 而 低 于 某国 
值 时 为 无 电 人 向 状态 ,存储 的 是 "0”。 其 保持 、 读 出 和 写 人 的 工 图 4-11 动态 RAM 组 成 
作 原 理 如 下 : 结构 图 


= 位 线 D 
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保持 : 字 选 线 W 为 低 电 平 , 则 全 截止 ,使 得 电容 C 与 外 部 位 线 D 之 间 的 连接 断 开 ,C 上 
电容 的 状态 保持 不 变 , 从 而 所 存储 的 信息 能 保持 。 

写 人 : 字 选 线 W 为 高 电位 , 则 荆 导 通 。 和 大写 和 人 “1”, 则 在 位 线 D 上 加 高 电位 ,对 C 进行 
充电 ,使 电容 C 充满 电 答 ,从 而 处 于 “1” 状 态 ; 大写 人 “0”, 则 在 D 线 上 加 低 电 位 ,C 通过 位 线 
D 对 外 进行 放电 ,从 而 变 为 ”07 状态。 

读 出 : 字 选 线 W 线 为 高 电位 , 工 导 通 。 奉 原来 存储 的 是 "1”, 则 C 通过 工 管 回 位 线 DD 
放电 ,在 DD 线 上 可 检测 到 电流 流出 ,如 此 读 出 了 “1”; 和 若 原 来 存储 的 是 “0”, 则 在 位 线 D 上 检 
测 不 到 电流 流出 ,如 此 读 出 了 “0”。 

从 以 上 的 读 出 过 程 可 以 看 出 ,动态 RAM 的 读 出 是 一 种 破坏 性 读 出 , 即 如 果 位 单元 原来 
存储 的 是 “1”, 则 经 读 出 操作 后 ,其 状态 变 成 了 “0”。 因 此 ,动态 RAM 单元 电路 在 经 过 读 出 
操作 后 需要 再 进行 “ 回 写 ?操作 。 

另外 ,动态 RAM 单元 电路 的 保持 状态 无 法 做 到 像 静 态 RAM 那样 理想 地 保持 。 动 态 
RAM 在 保持 状态 下 , 字 选 线 为 低 电 位 , 工 管 截止 。 理 论 上 电容 C 与 外 界 的 连接 被 断 开 ,C 

F 的 电荷 状态 能 保持 不 变 。 但 实际 上 ,电容 C 与 位 线 D 之 间 的 通路 上 总 会 有 漏电 流 的 存 
在 ,使 得 原来 充满 电荷 存储 “1? 信 息 的 C 会 逐渐 对 外 放电 ,电荷 随 之 丢失 ,从 而 也 使 其 状态 
变 成 了 “0”。 为 解决 动态 RAM 单元 电路 存在 的 这 一 问题 ,一 种 有 效 的 解决 办 法 就 是 定时 地 
对 单元 电路 进行 刷新 ,刷新 的 方式 是 周期 性 地 对 动态 RAM 单元 电路 进行 和 逐 行 地 无 输出 的 
“ 读 出 - 回 写 ”操作 ,使 每 个 存储 单元 电路 在 信息 丢失 前 进行 及 时 的 恢复 。 动 态 RAM 的 刷新 
方法 主要 有 两 种 : 一 是 在 动态 RAM 内 部 设计 刷新 电路 ,存储 带 能 目 身 完成 刷新 工作 ; 二 是 
在 设计 主 存储 般 系 统 时 ,额外 设计 刷新 外 围 电路 ,由 CPU 使 用 专门 的 刷新 周期 对 动态 
RAM 进行 刷新 操作 。 

从 上 次 对 整个 存储 右 刷 新 结束 到 下 次 对 整个 存储 器 全 部 刷新 一 遍 为 止 的 时 间 间 隔 称 为 
刷新 周期 ,一般 为 2ms。 常 用 的 刷新 方式 有 三 种 : 集中 式 刷 新 、 分 散 式 刷新 和 异步 刷新 。 

1) 和 集 中式 刷新 

在 整个 刷新 间隔 内 ,前 一 段 时 间 用 于 正常 的 读 / 写 操作 ,而 在 后 一 段 时 间 停 止 读 / 写 操 
作 , 逐 行 进行 刷新 。 集 中 刷新 是 在 规定 的 一 个 刷新 半期 内 ,对 全 部 存储 单元 集中 一 段 时 间 球 
行进 行 刷 新 ,此刻 必 须 俘 止 谈 / 写 操作 。 这 种 方法 的 缺点 在 于 出 现 了 访 存 " 死 区 ” ,对 高 速 遍 
效 的 计算 机 系统 工作 是 不 利 的 。 

2) 分 散 式 刷新 

分 散 式 刷新 是 指 对 每 行 存储 单元 的 刷新 分 散 到 每 个 谈 / 写 周期 内 完成 。 把 存 取 周 期 分 
成 两 段 ,前 半 段 用 来 读 写 或 维持 ,后 半 段 用 来 刷新 。 这 种 刷新 克服 了 集中 刷新 出 现 的 “ 死 区 ” 
缺点 ,但 它 并 不 能 提高 整 机 的 工作 效率 。 

3) 寞 步 刷 新 

异步 刷新 方式 是 前 两 种 方式 的 结合 ,为 了 真正 提高 整 机 的 工作 效率 ,应 该 采用 集中 与 分 
散 相 结合 的 方式 , 既 克 服 出 现 “ 死 区 ”, 又 充分 利用 最 大 刷新 间隔 为 2ms 的 特点 。 

动态 RAM 的 必 片 构成 与 静态 RAM 的 相同 ,所 不 同 的 是 位 单元 电路 的 构成 和 存储 机 
制 。 从 以 上 两 者 的 单元 电路 也 可 以 看 出 ,动态 RAM 的 单元 电路 构成 更 简单 ,因此 , 单 片 动 
态 RAM 芯片 的 容量 更 大 。 另 外 ,由 于 动态 人 AM 的 读 出 需要 回 写 和 刷新 ,因此 ,动态 人 AM 
的 速度 比 静 态 RAM 的 慢 。 当 然 ,静态 人 AM 的 制作 成 本 相对 较 高 。 基 于 动态 RAM 和 静态 
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RAM 的 这 些 特点 ,动态 RAM 主要 用 于 构成 计算 机 主 存储 责 ,而 静态 RAM 主要 用 于 构成 
快速 的 cache。 


3. ROM 的 组 成 及 工作 原理 


根据 ROM 种 类 的 不 同 ,位 单元 电路 的 组 成 也 有 所 不 同 。 

对 于 掩 膜 式 ROM 来 讲 , 它 的 基本 位 单元 电路 使 用 二 极 管 或 晶体 管 做 成 , 且 根 据 用 户 程 
序 或 数据 的 需要 分 别 制作 ,做 管子 的 地 方 表 示 存 储 了 12, 没 做 管子 的 地 方 表示 丰 
由 于 每 一 位 上 的 管子 是 做 死 的 ,因此 ,其 内 容 是 无 法 修改 的 。 

图 4-12 给 出 了 一 个 掩 膜 式 ROM 的 组 成 示意 图 ,其 工作 原理 是 : 经 行 、 列 地 址 译 码 ,各 
有 一 条 地 址 线 被 选中 ( 行 方向 来 高 电位 , 列 方向 来 低 电 位 ) ,交叉 处 则 为 被 选中 的 单元 。 知 交 
叉 处 有 三 极 管 , 则 被 导 通 ,输出 处 为 低 电 位 ,表示 读 出 了 1; 大 交叉 处 无 三 极 管 , 则 被 截止 , 输 
出 处 为 高 电位 ,表示 该 出 了 0。 


列 详 码 瑚 


图 4-12 ” 掩 膜 式 ROM 组 成 的 示意 图 


而 对 于 PROM 来 讲 , 其 每 一 位 位 单元 上 均 制 作 了 品 体 管 , 只 是 这 种 管子 非 间 特 殊 ,经 过 
一 次 写 人 烧 制 后 ,其 状态 发 生变 化 , 且 无 法 还 原 , 故 只 具有 一 次 可 编程 功能 。 有 两 种 用 于 制 
作 PROM 位 单元 的 晶体 管 : 一 种 是 熔断 丝 型 ,这 种 PROM 是 在 每 一 个 晶体 管 的 发 射 极 上 
串 接 一 个 熔断 丝 ,芯片 出 厂 时 熔断 丝 全 部 为 正常 导 通 状态 (全 1 状态 ), 当 要 对 某 一 位 改写 
时 ,只 和 需 将 这 一 位 上 唱 体 管 的 熔断 丝 烧 断 , 则 员 体 管 将 永远 处 于 截止 状态 ,表示 存储 了 0; 男 
一 种 是 结 击 罕 型 ,这 种 PROM 是 在 每 一 个 品 体 管 的 发 射 极 上 串 接 一 个 反 回 二 极 管 , 心 片 出 
三 时 反 加 二极管 使 每 个 晶体 管 处 于 截止 状态 (全 0 状态 ) , 当 要 对 某 一 位 改写 时 ,只 需 将 这 一 
位 上 的 二 极 管 击 穿 , 则 晶体 管 将 永远 处 于 导 通 状态 ,表示 存储 了 1。PROM 由 于 只 能 进行 一 
次 改写 ,因此 目前 已 很 少 使 用 。 

现在 取代 PROM 的 主要 是 UVEPROM 和 EPROM。 有 关 它 们 的 存 
的 限制 ,此 不 再 蒙 述 ,读者 有 兴趣 可 参考 相关 资料 。 


记 原 角 ， 上 于 篇 性 
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称 闪 存 ) ,是 在 EPROM 的 基础 上 发 展 起 来 的 一 种 
新 型 半导体 存储 器 ,于 1983 年 推出 ,1988 年 逐渐 商品 化 ,进入 20 世纪 90 年 代 中 后 期 开始 
逐步 得 到 广泛 应 用 。 从 功能 特性 上 讲 , 它 可 以 归属 于 ROM, 因 为 它 具 有 非 易 失 性 的 特点 。 
但 从 目前 计算 机 的 使 用 上 讲 , 它 是 作为 计算 机 外 部 存储 器 来 使 用 的 。 在 速度 、 集 成 度 和 成 本 
上 ,Flash Memory 与 传统 的 用 于 计算 机 主 存 ROM 的 芯片 相近 ; 而 在 使 用 上 ,Flash 
Memory 可 以 像 磁 盘 等 计算 机 辅助 存储 如 一样 通 过 一 定 的 接口 与 主机 相连 ,但 却 比 磁 熏 等 
更 方便 , 它 无 须 配备 像 对 磁盘 进行 谈 写 操作 的 机 电 设 备 。 因 此 ,Flash Memory 日 诞生 之 日 
起 就 得 到 了 广泛 的 应 用 , 除 可 用 作 计 算 机 外 存 外 (U 盘 ) ,一 些 家 用 电器 产品 ,如 手机 、 数 三 
相机 、MP3 等 中 的 存储 冀 均 使 用 的 是 Flash Memory。 

传统 的 “CPU- 主 存 - 辅 存 ” 工 作 模 式 是 将 可 执行 程序 先 存 放 在 辅 存 中 , 当 要 运行 时 ,由 
OS 将 其 从 辅 存 调 和信 主 存 中 。OS 承担 了 对 辅 存 和 主 存 的 空间 分 配 及 管理 等 工作 ,系统 开销 
较 大 。 而 车 采用 新 型 的 “CPU-Flash Memory” 工 作 模 式 ,Flash Memory 相当 于 传统 主 存 和 
辅 存 的 合 二 为 一 ,CPU 可 和 卫 接 运行 已 经 存放 在 因 存 中 的 可 执行 程序 。 这 样 既 可 人 简化 系统 的 
人 硬件 设计 ,又 可 大 大 降低 系统 的 开销 。 随 着 Flash Memory 成 本 的 降低 和 集成 度 的 提高 ,将 
来 的 某 一 天 ,“CPU-Flash Memory” 工 作 模 式 有 可 能 取代 “CPU- 主 存 - 辅 存 ” 模 式 , 这 将 引起 
计算 机 系统 结构 的 巨大 变化 ,这 种 变化 将 使 得 计算 机 的 使 用 更 加 灵活 和 方便 。 


知识 拓展 


新 型 动态 存储 器 SDRAM 和 DDR DDR2 和 DDR3 

SDRAM 的 全 称 为 同步 动态 随机 存 取 存储 器 (Synchronous Dynamic Random Access 
Memory) ,是 一 种 新 型 动态 存储 器 。 传 统 的 DRAM 是 异步 工作 的 ,CPU 向 存储 器 发 送 地 址 
和 控制 信号 后 , 需 等 待 存储 器 进行 内 部 操作 (地 址 译 码 、. 读 出 信号 放大 、 输 出 缓冲 等 ) ,从 而 影 
响 了 系统 性 能 。 而 SDRAM 与 CPU 之 间 是 同步 工作 的 ,在 进行 存储 器 内 部 操作 的 同时 ,人 允 
许 CPU 做 其 他 事情 ,而 无 须 空 等 待 。 

DDR 全 称 为 双 倍 速率 同步 动态 随机 存 取 存储 器 , 即 DDR SDRAM(Double Date Rate 
Synchronous Dynamic Random Access Memory) ,是 一 种 在 SDRAM 基础 上 发 展 起 来 的 有 具 
有 双 数 据 迷 率 的 新 型 动态 存储 器 ,由 三 星 公 司 于 1996 年 提出 ,由 日 本 电气 、 三 鞭 、 富 士 通 、 东 
芝 .日立 ,德州 仪器 三星 及 现代 8 家 公司 协议 订立 内 存 规格 ,并 得 到 了 AMD、VIA 与 SiS 等 主 
要 芯片 组 厂商 的 支持 。SDRAM 是 在 每 一 个 时 钟 周 期 的 时 钟 的 上 升 沿 进行 一 次 数据 传输 ;而 
DDR 则 是 在 每 一 个 时 钟 周期 内 传输 两 次 数据 , 即 分 别 在 时 钟 的 上 升 沿 和 下 降 沿 各 传输 一 次 数 
据 ,因此 称 为 双 倍 速率 同步 动态 随机 存 取 存储 器 。DDR 内 存 可 以 在 与 SDRAM 相同 的 总 线 频 
率 下 达到 更 高 的 数据 传输 率 。 目 前 很 多 计算 机 都 使 用 了 DDR 存储 器 芯片 作为 其 主 存储 器 。 

DDR2/DDR [TCDouble Data Rate 2)SDRAM 是 由 JEDEC( 电 子 设备 工程 联合 委员 会 ) 
进行 开发 的 新 生 代 内 存 技术 标准 , 它 与 上 一 代 DDR 内 存 技术 标准 最 大 的 不 同 就 是 ,虽然 同 
是 采用 了 在 时 钟 的 上 升 / 下 降 延 同时 进行 数据 传输 的 基本 方式 ,但 DDR2 内 存 却 拥有 两 倍 
于 上 一 代 DDR 内 存 预 读 取 能 力 ( 即 4b 数据 读 预 取 )。 换 和 名 话说 ,DDR2 内 存 每 个 时 钟 能 够 
以 4 倍 外 部 总 线 的 速度 读 / 写 数据 ,并 且 能 够 以 内 部 控制 总 线 4 倍 的 速度 运行 。 

DDR3 有 是 一 种 电脑 内 存 规 格 。 它 属于 SDRAM 和 家族 的 内 存 产 品 , 提 供 了 相 较 于 DDR2 
SDRAM 更 高 的 运行 效能 与 更 低 的 电压 ,是 DDR2 SDRAM(4 们 资料 率 同 步 动 态 随机 存 取 
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内 存 ) 的 后 继 者 (增加 至 8 倍 ) ,也 是 现时 流行 的 内 存 产 品 。 
4.2.3 主 和 存储 怖 的 设计 


半导体 存储 器 是 构成 现代 计算 机 主 存储 髓 的 主要 存储 介质 ,在 进行 计算 机 主 存储 肯 设 
计时 ,主要 考虑 以 下 几 方 面 的 因素 : 

(1) 存储 冀 局 片 的 选择 ,半导体 存储 
储 絮 时 ,应 根据 需要 合理 选择 。 

(2) CPU 与 存储 天 的 速度 匹配 ,机 硕 的 性 能 是 由 多 方面 的 因素 决定 的 ,其 中 CPU 访 存 
速度 是 影响 机 器 性 能 的 关键 因素 之 一 ,高 性 能 CPU 需要 高 速 的 存储 项 相 匹 配 。 

(3) 存储 右 与 CPU 的 信号 连接 ,主要 包括 数据 信号 线 、 地 址 信号 线 和 控制 信号 线 的 连接 等 。 


信心 片 种 类 款 多 ,在 选择 存储 天 必 片 构成 机 天 主 存 


1. 半导体 存储 冀 心 三 


半导体 存储 着 必 片 的 性 能 主要 体现 在 两 个 方面 : 一 是 忆 片 的 容量 ,二 是 心 片 的 存 取 速 

度 。 存 储 血 心 片 的 容量 可 以 表征 为 以 下 形式 : 
容量 三 字数 关 位 

其 中 ,字数 表示 存储 前 必 片 所 具有 的 字 单 无效 ,而 位 数 则 表示 每 一 个 字 单 元 所 具有 的 位 单 匹 
数 。 例 如 ,前 态 RAM 必 片 2114 的 容量 为 1KX4b, 则 表示 该 心 片 共有 1024 个 字 单 元 ,每 个 
字 单 元 的 位 数 为 4b, 也 就 是 说 ,对 2114 的 访问 ,一 次 可 同时 读 / 写 4b。 再 如 ,只 读 存 储 蕴 
ROM 芯片 2716 的 容量 为 2KX 8b, 则 表示 该 芯片 共有 2048 个 字 单 元 ,每 个 字 单 元 的 位 数 为 
8b, 也 就 是 说 ,对 2716 的 访问 ,一 次 可 以 并 行 谈 出 8b。 

半导体 存储 胡 必 上 厂 是 通过 引出 脚 与 外 部 连接 的 。 引 出 脚 主 要 包括 4 类 : 数 
址 引 脚 .控制 引 脚 和 电源 及 接地 引 脚 。 图 4-13(a) ,图 4-13(b)、 图 4-13(c) 分 别 给 出 的 是 三 种 
芯片 256Kb 的 SRAM.16Mb 的 DRAM 和 8Mb 的 EPROM 的 引 脚 图 。 


32Kbx8 


(a) SRAM (DDRAM (c) EPROM 


图 4-13 ”芯片 引 脚 医 
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对 图 4-13(a) 的 SRAM 芯片 来 说 ,各 引 脚 的 功能 如 下 。 

(1) 引 脚 A, 一 As: 15 条 地 址 信号 线 , 用 于 访问 25 王 32K 的 字 单 元 ,该 地 址 是 CPU 访 
存 时 给 出 的 ， en 

(2) 引 脚 IO 一 IO;,: 8 条 数据 信号 线 。CPU 对 存储 器 进行 读 操 作 时 ,数据 的 流向 是 
从 存储 顺 到 CPU 的 ; CPU 对 存储 右 进 行 写 操 作 时 ,数据 的 流 癌 是 从 CPU 到 存储 器 的 ,所 
处 数据 信和 号 线 为 输入 输出 双 四 。 

(3) 引 脚 CE: 为 片 选 控制 信号 线 。 当 CPU 访 存 时 ,必须 在 这 个 引 脚 上 加 载 一 个 有 效 信 
号 ,才能 使 存储 甫 必 片 工作 。 

(4) 引 脚 WE: 读 写 控制 信号 。 当 CPU 对 芯片 进行 写 操作 时 ,在 该 引 脚 上 加 载 一 个 低 
电 平 信号 ; 当 对 芯片 进行 读 操作 时 ,在 该 引 脚 ten lt 

(5) 引 脚 OE: 输出 允许 控制 信号 。 当 对 必 片 进行 读 操作 时 ， 还 必须 将 此 信号 置 为 有 效 。 

(6) 引 脚 Vcc 和 GND: 分 别 为 忆 片 的 工作 电源 和 接地 线 。 

对 图 4-13(b) 的 DRAM 世 片 来 说 ,各 引 脚 的 功能 如 下 。 

(1) 引 脚 Au 一 Au: 11 条 地 址 信号 线 。 很 多 DRAM 世 片 地 址 引 脚 数 往往 是 实际 所 需 
地 址 信和 号 鼻 的 一 六 ， 本 芯片 就 属于 这 种 情况 。 本 来 4M 的 字 单 元 需要 22 条 地 址 线 (22 一 
4M) ,但 该 芯片 只 有 11 条 地 址 引 脚 。 当 CPU 对 该 芯片 进行 读 / 写 操作 时 ,其 地 址 经 外 围 电 
路 分 为 高 11 位 行 地 址 和 低 11 位 列 地 址 ,分 先后 送 到 芯片 的 地 址 端 ,并 分 别 锁 存 到 芯片 内 部 
的 行 、 列 地 址 锁 存 右 中 。 

(2) 引 脚 D, 一 D, : 4 条 数据 信号 线 , 在 标注 上 与 上 一 必 片 稍 有 不 同 。 

(3) 引 脚 RAS、CAS: 分 别 用 于 行 、 列 地 址 的 锁 存 控制 。 

(4) 引 脚 OE 和 WE: 同上 。 

图 4-13(c) 的 EPROM 芯片 的 引 脚 与 上 述 两 个 芯片 的 基本 类 似 , 只 是 多 出 了 一 个 电源 
Voo ,该 电源 引 脚 主要 用 于 对 芯片 进行 编程 改写 时 加 载 一 个 25V 的 电压 ,使 之 在 特殊 条 件 下 
进行 改写 操作 。 

在 有 些 场 合 ,为 突出 改 片 的 引 脚 功能 ,也 第 第 给 出 它们 的 引 脚 符号 图 。 例 如 ,前 面 讲 到 
的 静态 RAM 世 片 2114 和 动态 RAM 芯片 2716 的 引 脚 符号 图 如 图 4-14 所 示 。 


(a) 2114 的 9| 脚 全 号 图 (b) 2716 的 5| 脚 付 号 图 
图 4-14 芯片 引 脚 符号 图 
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引 脚 符号 图 是 将 地 址 信号 线 .数据 信号 线 和 控制 信号 线 分 别 列 在 芯片 框 的 不 同 侧 ,并 标 
明 这 些 信 号 的 输入 输出 方向 ,对 于 控制 信和 号 还 需 标 明 它 们 是 低 电 平 有 效 还 是 高 电 平 有 效 。 
这 种 图 可 使 人 们 对 已 片 的 功能 一 目 了 然 。 
知识 拓展 

心 卢 的 封闭 技术 

人 们 经 常 听 说 某 某 芯片 采用 什么 样 的 封装 方式 ,在 计算 机 中 存在 着 各 种 各 样 不 同 的 集 
成 电路 芯片 ,那么 ,它们 又 是 采用 何 种 封装 形式 的 呢 ? 下 面 对 一 些 常 见 的 芯片 封装 技术 作 一 
个 介绍 。 

1) DIP 

DIP(Dual In-line Package) 有 是 指 来 用 双 列 直播 形式 封 和 要 的 集成 电路 已 片 , 绝 大 多 数 中 小 
规模 集成 电路 芯片 均 采 用 这 种 封装 形式 ,其 引 脚 数 一 般 不 超过 100 个 。 采 用 DIP 封装 的 
CPU 芯片 有 两 排 引 脚 ,需要 插入 具有 DIP 结构 的 芯片 插座 上 。 当 然 , 也 可 以 直接 插 在 有 相 
同 焊 孔 数 和 几何 排列 的 电路 板 上 进行 焊接 。DIP 封装 的 芯片 在 从 芯片 插座 上 插 拔 时 应 特别 
小 心 ,以 免 损 坏 引 脚 。Intel 8088 CPU 和 时 期 的 内 存世 有 片 就 采用 这 种 封装 形式 。 

2) QrP 

QFP(Plastic Quad Flat Package) 封 装 的 芯片 引 脚 之 间距 离 很 小 , 引 及 和 
模 或 超大 规模 集成 电路 都 采用 这 种 封装 形式 ,其 引 脚 数 一 般 在 100 个 以 上 。 用 这 种 形式 
封装 的 芯片 必须 未 用 SMD( 表 面 安 装 设 备 技术 ) 将 已 片 与 主板 焊接 起 来 。 示 用 SMD 安 准 
的 芯片 不 必 在 主板 上 打 孔 ,一 般 在 主板 表面 上 有 设计 好 的 相应 引 脚 的 焊 点 。 将 芯片 各 脚 
对 准 相 应 的 焊 点 , 即 可 实现 与 主板 的 焊接 。 用 这 种 方法 焊 上 去 的 蕊 有 厂 , 如 果 不 用 专用 工 
具 是 很 难 拆 部 下 来 的 。Intel 系列 CPU 中 80286、80386 和 某 些 486 主板 采用 这 种 封装 
形式 。 

3) PGA 

PGA(Pin Grid Array Package) 芯 片 封装 形式 在 芯片 的 内 外 有 多 个 方 阵 形 的 插 针 ,每 个 
方 阵 形 插 针 沿 芯片 的 四 周 间 隔 一 定 距 离 排 列 。 根 据 引 脚 数 目的 多 少 , 可 以 围 成 2~5 圈 。 安 
装 时 ,将 芯片 插入 专门 的 PGA 插座 。 为 使 CPU 能 够 更 方便 地 安装 和 拆卸 ,从 486 芯片 开 
始 , 出 现 一 种 名 为 ZIF 的 CPU 插座 ,专门 用 来 满足 PGA 封装 的 CPU 在 安装 和 折 印 上 的 要 
求 。ZIF(CZero Insertion Force) 有 是 指 零 插 拔 力 的 插座 ,把 这 种 插座 上 的 扳 于 轻 轻 抬 起 ,CPU 
就 可 以 很 容易 .轻松 地 插入 插座 中 ,然后 将 扳手 压 回 原 处 ,利用 插座 本 身 的 特殊 结构 生成 的 
挤 压力 ,将 CPU 的 引 脚 与 插座 牢 牢 地 接触 ,绝对 不 存在 接触 不 良 的 问题 。 而 拆 孝 CPU 让 
T 只 需 将 插座 的 扳手 轻 轻 抬 起 , 则 压力 解除 ,CPU 芯片 即 可 轻松 取出 。Intel 系列 CPU 中 ， 
80486 和 Pentium 、Pentium Pro 均 采用 这 种 封 闲 形式。 

4) BGA 

随 镍 集成 电路 技术 的 发 展 , 对 集成 电路 的 封装 要 求 更 加 严格 , 当 IC 的 引 脚 数 大 于 208 
Pin 时 ,传统 的 封装 方式 比较 困难 。 因 此 , 除 使 用 QFP 等 封装 方式 外 ,现今 大 多 数 的 高 脚 数 
芯片 (如 图 形 芯 片 与 芯片 组 等 ) 若 转 而 使 用 BGA(CBall Grid Array) 封 装 技 术 。BGA 一 出 现 
便 成 为 CPU ,主板 上 南 / 北 桥 忌 片 等 高 密度 、 高 性 能 、 多 引 肢 封装 的 最 佳 选 择 。Intel 公司 在 
其 CPU Pentium 上 Pentium 册 Pentium 4 等 ,以 及 芯片 组 中 开始 使 用 BGA 
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9) CSP 

随 镍 全 球 电 子 产 品 个 性 化 、 轻 巧 化 的 需求 逐渐 增加 ,封装 技术 已 进步 到 CSP(Chip Size 
Package)。 它 减 小 了 站 片 封 装 外 形 的 尺寸 ,做 到 裸 走 片 尺 寸 有 多 大 ,封装 尺寸 就 有 多 大 。 即 
封 儿 后 的 IC 尺寸 边 长 不 大 于 芯 且 的 1.2 倍 。 

CSP 封装 适用 于 脚 数 少 的 IC, 如 内 存 条 和 便携 电子 产品 。 未 来 则 将 大 量 应 用 在 信息 家 
电 (IA) 数字 电视 (DTV) .电子 书 (E-Book) 无 线 网 络 (WLAN) 、Gigabit Ethemet、ADSL、 
手机 法 片 ,蓝牙 (Bluetooth) 等 新 兴 产 品 中 。 


2. 半导体 存储 兹 读 写 周期 


前 面 已 经 提 到 ,在 选择 存储 融 改 片 构成 计算 机 主 存 储 器 时 ,要 考虑 CPU 与 存储 器 之 间 
的 速度 匹配 。 存 储 冀 在 出 三 时 ,其 存 取 速度 就 已 经 确定 ,厂家 在 对 心 片 的 有 关 技 术 说 上 
给 出 其 存 取 速 度 的 相关 技术 参数 ,这 一 技术 参数 主要 是 通过 存储 部 的 谈 写 周期 (又 称 为 存储 
周期 ) 来 反映 的 ,而 读 写 周期 是 通过 波形 图 (又 称 时 序 图 ) 来 体现 的 。 下 面 以 静态 RAM 芯片 
2114 为 例 对 存储 问 的 读 写 周期 加 以 说 明 。 

2114 的 读 周 期 波形 图 如 图 4-15 所 示 。 


2 


tec 一 访 周 期 时 间 

锥 一 仓 取 时 间 

ico 一 片 迹 保持 时 间 

fx 一 片 迹 有效 到 数据 输出 有 将 时 间 


4-15 2114 的 读 周 期 波形 


其 中 , 读 周 期 时 间 zc 就 是 指 CPU 对 2114 芯片 进行 读 操作 所 需要 的 时 间 , 这 一 时 间 一 
方面 说 明 , 若 要 从 2114 中 读 取 一 个 字 单 元 ,至 少 需要 经 过 trc 的 时 间 ; 另 一 方面 说 明 , 若 要 
完成 对 2114 的 正确 读 操 作 ,CPU 加 载 在 2114 芯片 地 址 引 脚 上 的 地 址 信号 需要 至 少 维持 
iRc 的 时 间 。 

时 间 如 表示 2114 在 CPU 加 载 的 地 址 有 效 后 ,经 过 如 时 间 后 可 以 将 数据 读 出 到 数据 线 
上 。 另 外 ,为 使 芯片 工作 , 片 选 信号 CS 还 必须 紧 跟 地 址 信号 之 后 产生 , 且 应 在 数据 有 效 读 出 
的 zcx 时 间 之 前 给 出 , 且 必 须 维 持 至 少 tco 的 时 间 。 

CPU 是 通过 一 个 读 周 期 来 完成 对 存储 天 的 读 操 作 的 ,而 读 周期 产生 的 地 址 .控制 等 信 
号 只 有 满足 以 上 时 序 要 求 ,才能 保证 读 操作 的 正确 性 。 因 此 ,在 进行 机 上 需 硬 件 系 统 设 计时 ， 
一 方面 要 保证 逻辑 电路 设计 的 正确 性 , 男 一 方面 还 要 保证 时 序 设计 的 正确 性 ,两 者 缺 一 
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不 可 ， 
2114 的 写 周 期 波形 图 如 图 4-16 所 示 。 


iwc 一 写 周 其 时间 

tw 一 写 信号 时 间 

tpw 一 写 信 号 结束 前 数据 给 出 的 时 间 
thy 一 写 信 号 结束 后 数据 保持 的 时 间 


图 4-16 2114 的 写 周 期 波形 


其 中 , 写 周期 时 间 twc 就 是 指 CPU 对 2114 芯片 进行 写 操作 所 需要 的 时 间 , 也 就 是 说 ,车 
要 向 2114 中 写 人 一 个 字 单 元 ,需要 至 少 twc 的 时 间 。 一 般 来 讲 ,半导体 存储 器 的 读 周 期 时 间 
和 写 周期 时 间 是 相同 的 ,这 一 时 间 就 是 存储 器 芯片 的 存 取 时 间 。 存 取 时 间 越 小 ,存储 器 的 束 
度 就 越 快 ; 反之 , 存 取 时 间 越 大 ,存储 器 的 速度 也 就 越 慢 ， 

动态 存储 器 和 只 读 存 储 器 的 读 写 周期 与 静态 存储 器 的 类 似 ,此 不 再 蓉 述 。 


3. 半导体 存储 希 与 CPU 的 连接 


在 构成 计算 机 主 存储 佛 时 ,还 需要 根据 机 和 冀 容量 的 要求 和 所 选用 的 半导体 存储 侣 心 】) 
容量 的 情况 进行 综合 设计 。 当 单 片 存 储 善 必 片 的 容量 不 能 直接 满足 主 存 储 前 容量 的 要 求 
时 ,需要 选择 多 片 进行 容量 扩展 连接 ,以 构成 主 存储 天 模块 。 下 面 分 三 种 情况 介绍 存储 甫 的 
容量 扩展 连接 。 

1) 位 扩展 连接 

设 主 存储 器 的 容量 为 MX N 位 ,而 选用 的 存储 器 芯 
片 的 容量 为 MXn 位 ,其 中 ,N 是 n 的 整数 倍 。 在 这 种 情 
况 下 , 单 片 存 储 器 芯片 的 字 单 元 数 与 主 存 储 需 的 相同 ， 
但 每 个 字 单 元 的 位 数 不 能 满足 主 存储 器 的 要 求 。 这 时 ， 
需要 进行 一 种 位 扩展 连接 ,使 用 N/n 片 芯 片 并 联 起 来 ， 
如 图 4-17 所 示 ,具体 的 连接 方法 是 : 

(1) 所 有 必 片 的 地 址 线 A 对 应 连接 在 一 起 。 

(2) 所 有 芯片 的 片 选 信号 线 CE 对 应 连接 在 一 起 。 

(3) 所 有 芯片 的 读 写 WE 线 对 应 连接 在 一 起 。 

(4) 每 个 已 片 的 数据 线 各 自 单 独 引 出 。 图 4-17 位 扩展 连接 


效 据 D 


数据 DD 
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采用 这 种 方式 连接 后 ,每 一 次 CPU 来 的 地 址 同时 选中 所 有 芯片 的 同一 个 字 单 元 , 且 地 
址 线 数 未 增加 ,也 就 意味 着 整个 存储 体 的 字数 为 M; CE 同时 选中 所 有 芯片 工作 ,而 WE 同时 
使 所 有 芯片 读 或 写 ; 最 后 ,由 于 各 芯片 的 数据 线 是 单独 引出 的 ,被 同时 选中 的 芯片 各 上 和 目 有 7 
条 数据 线 引 出 ,加 起 来 正好 N 条 , 若 将 这 NA/ 个 芯片 看 成 一 个 整体 ,那么 其 容量 就 是 MX 
N 位 ,正好 符合 主 存 储 髓 的 要 求 。 

下 面 举 一 个 例子 进一步 说 明 位 扩展 连接 的 存储 髓 芯片 与 CPU 的 连接 。 

【 例 4.1】 使 用 一 种 64MX4b 的 存储 骨 忆 片 构 成 64MX 16b 的 主 存储 右 , 并 与 一 个 
16b 的 CPU 连接 。 


解 : 64MX 4b 的 存储 器 芯片 构成 64M X 16b 的 主 存储 器 需要 的 芯片 关 


4( 片 ) ,并 进行 位 扩展 连接 ,如 图 4-18 所 示 。 


为 16/4 王 


图 4-18 芯片 位 扩展 与 CPU 的 连接 


2) 字 扩 展 连 接 

字 扩 展 连接 的 情况 是 : 设 主 存储 器 的 容量 为 MX N 位 ,而 选用 的 存储 器 芯片 的 容量 ; 
mXN 位 ,其 中 ,M 是 mm 的 整数 倍 。 在 这 种 情况 下 , 单 片 存 储 需 忆 片 的 字 单 元 位 数 与 主 存储 
佣 的 相同 ,但 每 个 心 片 的 字音 元 数 不 能 满足 主 存储 天 的 要 求 。 这 时 ,需要 进行 一 种 字 扩 展 连 
接 ,使 用 M/m 片 忆 片 连 接 起 来 ,如 图 4-19 所 未 ,具体 连接 方法 是 : 
连接 在 一 起 。 

(2) 所 有 芯片 的 数据 线 对 应 连接 在 一 起 。 

(3) 所 有 芯片 的 读 写 WE 线 对 应 连接 在 一 起 。 

(4) 每 个 芯片 的 片 选 信号 线 CE 各 自 单独 引出 ,并 由 
CPU 剩余 的 部 分 高 位 地 址 线 产 生 。 

采用 这 种 方式 连接 后 ,由 于 所 有 性 片 的 数据 线 是 并 联 
在 一 起 的 ,所 以 数据 位 数 不 变 ,每 次 读 写 的 为 N 位 ; CPU 
来 的 低位 地 址 同时 选中 所 有 忌 片 的 同一 个 字 单 元 ,再 由 高 

图 4 19 字 扩 展 连 接 位 译 码 产生 的 片 选 信号 CE 一 次 选中 一 个 芯片 工作 ,WE 控 

制 被 选中 的 芯片 读 或 写 ,共有 M/m 个 容量 为 m XNN 位 的 芯片 ,总 容量 就 是 MXN 位 ,正好 
符合 主 存储 页 的 要 求 。 

下 面 举 一 个 例子 进一步 说 明 字 扩展 连接 的 存储 兹 心 片 与 CPU 的 连接 。 


地 址 A 


CEw mm 
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【 例 4.2】 使 用 一 种 16MX 16b 的 存储 甫 必 片 构成 64M X16b 的 主 存储 硕 , 并 与 一 个 
16b 的 CPU 连接 。 
解 . 16MX 16b 的 存储 占 已 片 构 成 64M x 16b 的 主 存 储 占 需要 的 站 片 数 为 16/4 二 
4( 月) ,并 进行 行 字 扩展 连接 ,如 图 4-20 所 示 。 


lI6M x 16b 


图 4-20 ”芯片 字 扩展 与 CPU 的 连接 


其 中 ,CPU 的 地 址 线 Au 一 Ai 与 每 个 芯片 的 对 应 地 址 线 连接 ,Au 和 Ais 则 用 于 译 码 , 产 
生 对 4 个 芯片 的 片 选 控制 信号 , 且 这 4 个 片 选 信号 同时 只 有 一 个 为 有 效 , 选 中 一 个 芯片 工 
作 。CPU 的 数据 线 D, 一 D1; 与 每 个 芯片 的 对 应 数据 线 连接 。 

3) 字 位 扩展 连接 

字 位 扩展 连接 的 情况 是 : 设 主 存储 器 的 容量 为 MXN 位 ,而 选用 的 存储 器 芯片 的 容 
为 mXnb, 其 中 ,MN 分 别 是 m、n 的 整数 倍 。 在 这 种 情况 下 , 单 片 存储 疑心 片 的 字 单元 
数 和 字 单 元 的 位 数 均 不 能 满足 主 存储 需 的 要 求 。 这 时 ,需要 进行 一 种 字 位 扩展 连接 ,使 
用 CM/m) X(CNVD 个 忆 片 连接 起 来 ,连接 方法 就 是 将 以 上 两 种 情况 结合 起 来 孝感 。 


4.3 交叉 存储 技术 


1. 交 义 和 存储 拉 术 的 基本 思想 


先 来 看 一 个 生活 中 的 例子 。 假 设 某 一 产品 需要 两 道生 产 工 序 完 成 ,分 别 是 工序 1 和 工 
序 2, 且 两 道 工 序 采 用 流水 作业 的 方式 进行 。 现 在 安排 两 个 工人 A.、B 分别 做 工序 1 和 工序 
2, 其 中 工人 A 完成 工序 1 的 时 间 是 At, 而 工人 B 完成 工序 2 的 时 间 是 3At。 那 么 ,在 这 种 
情况 下 ,流水线 将 每 阳 3Az 的 时 间 生 产 出 一 个 该 产品 。 其 中 ,工人 B 需 连续 不 间断 地 工作 ， 
而 工人 A 则 可 以 每 工作 1 个 At 时 则 休 明 2 个 At 的 时 间 , 如 图 4-21 所 示 。 显 然 ,在 这 种 流 
水 作业 的 情况 下 ,工人 A 未 满 负 三 工 作 , 流 水 线 的 效率 也 未 能 真正 发 挥 出 来 。 

现在 改变 一 下 流水 模式 ,增加 2 个 工作 速度 与 B 相同 的 工人 C.D 痢 来 做 工序 2, 这 样 就 
是 工人 A 一 人 做 工序 1, 而 工人 B、C.D 三 人 同时 做 工序 2。 在 4 个 工人 都 满 负 停工 作 的 情 
况 下 ,流水 线 将 每 隔 At 的 时 间 生 产 出 一 个 该 产品 ,如 图 4-22 所 示 ，。 
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流水 线 传输 市 


图 4-21 流水线 生产 模式 1 


流水 线 传输 


图 4-22 流水线 生产 模式 2 


显然 ,后 一 种 模式 比 前 一 种 模式 生产 效率 提高 了 两 倍 , 而 其 代价 只 是 增加 了 两 个 工人 ， 
不 是 增加 4 个 工人 和 两 套 流 水 线 设备 。 

可 以 吸取 这 一 思想 ,应 用 到 计算 机 CPU 与 存储 系统 的 配置 上 。 由 于 CPU 的 速度 远 比 
存储 右 的 速度 快 , 当 采 用 单 CPU 和 单 存储 天 模块 时 ,CPU 每 进行 一 次 访 存 操作 ,都 需要 等 
竺 存储 融 的 操作 , 且 一 个 访 存 周期 只 能 从 单个 存储 弟 模 块 中 存 取 一 个 字音 元。 如 条 多 配置 
几 个 存储 器 模块 ,让 CPU 与 多 模块 的 存储 器 之 间 采 用 后 一 种 流水 模式 进行 工作 ,那么 ,就 
可 以 实现 一 个 访 存 周期 能 从 多 个 存储 上 项 模块 中 存 取 多 个 字 单 元 。 


2. 交叉 存储 颖 模块 的 组 织 


为 了 实现 CPU 在 一 个 访 存 周期 能 从 多 个 存储 剖 模 块 中 存 取 多 个 字 单 元 的 目标 ,还 知 
要 对 存储 右 模 块 的 组 织 进行 合理 地 配置 。 
传统 的 单 模 块 存 储 融 的 单元 地 址 是 进行 线性 编 址 的 ,也 就 是 从 一 个 最 低地 址 (通常 是 二 
进 制 全 0) 开 始 连 乡 编 址 到 一 个 最 高 地 址 ( 通 第 是 二 进 制 全 1)。 现 在 米 用 多 模块 存储 疾 结 
构 ,也 就 相当 于 将 传统 的 单 模 块 存 储 套 拆 分 为 多 个 模块 。 那 么 ,这 多 个 模块 如 何 编 址 是 人 们 
首先 要 研究 的 问题 。 
省 冀 共 有 32 个 字 单 元 ,分 为 4 个 模块 ,每 个 模块 有 8 个 字 单 元 。 和 考察 以 下 两 种 
模块 仍然 像 传 统 存 储 融 一样 进行 线性 编 址 , 即 模 块 1 的 单元 地 址 是 0 一 
7 ,模块 2 的 单元 地 址 是 8 一 15 ,模块 3 的 单元 地 址 是 16 一 23 ,模块 4 的 单元 地 址 是 24 一 31， 
如 图 4-23(a) 所 示 ; 二 是 采用 交叉 编 址 的 方式 , 即 模块 间 的 单元 地 址 是 连续 的 ,而 模块 内 的 
单元 地 址 是 不 连续 的 ,如 图 4-23(b) 所 示 。 


上 
“ 


数据 总 线 数据 总 线 
(a) 线性 万 云 lb) 交叉 方式 
图 4-23 ”存储 器 模块 的 组 织 方式 


在 采用 图 4-23(a) 的 线性 方式 编 址 的 情况 下 , 当 CPU 要 同时 访问 多 个 连续 的 存储 单元 
时 ,这 些 单元 分 布 在 同一 模块 的 概率 是 最 大 的 。 例 如 ,CPU 在 某 一 访 存 周期 需 癌 存储 天 旋 
4 个 字 单 元 的 数据 ,这 4 个 字 单 元 地 址 是 连续 的 ,那么 它们 只 有 可 能 分 布 在 一 个 或 两 个 存储 
模块 中 。 由 于 对 于 每 个 存储 模块 来 说 ,一 个 访 存 周期 只 能 读 写 一 个 字 单 元 ,因此 ,采用 这 种 
线性 编 址 方式 并 不 能 使 CPU 在 一 个 访 存 周期 存 取 多 个 字 单 元 。 

而 米 用 图 4-23(b) 的 交叉 编 址 方式 则 不 同 , 当 CPU 要 同时 访问 多 个 连续 的 存储 单元 
时 ,由 于 交叉 编 址 的 特殊 性 ,使 得 这 些 单元 会 分 布 在 不 同 模块 。 例 如 ,CPU 在 某 一 访 存 周期 
需 回 存储 器 读 4 个 字 单 元 的 数据 ,这 4 个 字 单 元 地 址 是 连续 的 ,那么 它们 会 分 别 分 布 在 4 个 
存储 模块 中 。 由 于 每 个 存储 模块 均 能 独立 地 进行 读 写 操作 ,这 就 使 得 CPU 在 一 个 访 存 周 
期 能 够 同时 存 取 多 个 字 单 元 。 

由 此 可 以 看 出 , 当 使 用 多 模块 存储 器 结构 时 ,对 模块 的 编 址 需 采 用 交叉 编 址 方式 ,才能 
真正 发 挥 出 多 模块 存储 器 的 效率 ,真正 实现 CPU 在 一 个 访 存 周期 同时 存 取 多 个 字 单 元 的 
目标 。 

不 过 要 注意 的 是 ,在 这 种 结构 下 ,CPU 是 通过 同一 条 数据 总 线 与 多 个 存储 模块 之 间 进 
行 数据 传送 的 ,而 数据 总 线 一 次 只 能 容纳 一 个 字 单 元 数据 。 因 此 ,这 多 个 存储 模块 必须 采取 
在 时 间 上 交错 开 来 的 方式 与 CPU 通过 数据 总 线 交 换 数 据 ,CPU 在 同一 访 存 周期 存 取 的 多 
个 字音 元 实际 上 并 不 是 完全 “同时 ”的 ,严格 来 讲 是 顺序 存 取 的 ,但 这 并 不 影响 所 实现 的 
CPU 一 个 访 存 周期 存 取 多 个 字音 元 的 目标 。 当 然 , 能 实现 这 一 目标 的 前 提 是 CPU 的 总 线 
操作 速度 远 比 存储 器 的 读 写 速度 快 ,理想 情况 下 , 若 CPU 的 总 线 操作 速度 是 存储 器 的 读 写 
速度 的 nn 信 , 则 应 卫生 个 少 于 n 个 存储 模块 与 CPU 相 匹 配 。 

下 面 再 通过 定量 分 析 , 比 较 一 下 传统 的 单 模块 和 多 模块 交叉 编 址 方式 的 存 取 速度 。 假 
设 每 个 模块 的 字 单 元 长 度 等 于 数据 总 线 宽度 ,存储 器 模块 的 存储 周期 为 T,CPU 的 总 线 传 
送 周 期 为 zx( 即 CPU 从 总 线 读 取 一 个 字 单 元 或 癌 总 线 写 一 个 字 单 元 的 时 间 为 r) ,存储 项 的 
交叉 模块 数 为 m, 为 了 实现 流水 线 方式 存 取 ,应 当 满 足 
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T= mr (4.1) 
则 CPU 与 单 模块 存储 舌 和 采用 交叉 编 址 方式 的 多 模块 存储 器 之 间 的 数据 存 取 示 意图 分 别 
如 图 4-24(a) ,图 4-24(b) 所 示 。 


0 Tr TH2r … 时 间 
T+t T+(n_1)r 


(a) 里 模块 存 人 备 航 (b) 多 醒 块 艾 叉 仓储 备 


到 4-24 存储 模块 的 存 取 方 式 


从 图 4-24 中 可 以 看 出 ,CPU 向 单 模块 存储 器 存 取 个 数据 所 需 的 总 时 间 为 xT, 采 用 的 
是 完全 顺序 存 取 方式 ; 而 CPU 向 多 模块 交叉 存储 器 存 取 n 个 数据 所 需 的 总 时 间 为 工 十 
(n 一 Dr, 采用 的 是 在 时 间 上 交错 开 来 的 并 行 存 取 方 式 。 把 这 连续 的 个 字 单 元 数据 的 存 取 
看 成 一 个 流水 操作 , 则 前 一 种 方式 是 每 间隔 工时 间 存 取 一 个 数据 ,而 后 一 种 方式 是 每 间隔 * 
的 时 间 存 取 一 个 数据 ,CPU 的 存 取 速 度 得 到 了 大 大 提高 。 


3. 变 叉 存储 兹 的 组 成 


为 实现 多 模块 交叉 存储 需 的 功能 , 光 对 这 多 个 模块 进行 交叉 编 址 是 不 够 的 ,还 需 对 
CPU 访 存 的 读 写 电路 进行 设计 。 在 多 模块 交叉 存储 系统 中 ,为 保证 每 个 模块 均 能 够 进行 独 
立 的 读 写 操作 , 需 为 每 个 存储 模块 配置 独立 的 读 写 电路 ,并 由 一 个 存储 器 控制 部 件 进行 顺序 
控制 。 

如 图 4-25 所 示 是 一 个 四 模块 交叉 存储 器 的 组 成 结构 图 。 图 中 ,4 个 存储 模块 各 配置 了 
一 套 独 立 的 读 写 电路 ,它们 在 一 个 存储 副 探 制 部 件 的 统一 控制 下 ,分 时 地 使 用 数据 上 总 线 完 成 
与 CPU 之 间 的 数据 传送 。 


存储 器 
控制 部 件 
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4.4 高 速 缓冲 存储 器 
半导体 存储 器 在 制作 工艺 上 有 所 不 同 , 不 同 制作 工艺 的 存储 器 在 存 取 速度 上 也 有 所 差 
般 来 讲 , 速 度 越 快 的 半 号 体 存 储 闸 其 价格 也 越 蜗 。 融 速 组 冲 存储 全 技术 是 一 种 使 用 
小 容量 快速 半导体 存储 器 件 实现 提高 CPU 访 存 速 度 的 有 效 方法 ,也 是 现代 计算 机 普遍 采 
用 的 一 种 方法 


4.4.1 cache 实现 的 基本 原理 
1. 程序 的 局 部 性 原理 


对 大 量 典 型 程序 运行 情况 的 分 析 结 果 表 明 ,在 一 个 较 短 的 时 间 间 隔 内 ,CPU 对 一 个 程 
序 指令 的 访问 往往 集中 在 一 个 较 小 的 存储 髓 逻辑 地 址 空间 范围 内 ,也 就 是 说 ,CPU 取 指 令 
数据 的 操作 具有 时间 上 局 部 分 布 的 倾 加 ,这 种 现象 称 为 程序 访问 的 局 部 性 ，。 

其 实 ,程序 访问 的 局 部 性 与 所 编制 程序 的 结构 特点 是 紧密 相关 的 。 人 们 都 知道 ,程序 从 
控制 结构 上 讲 主 要 包括 顺序 结构 、 分 文 结 构 、 循 环 结构 和 主子 程序 结构 等 。 一 般 来 讲 ,一 个 
典型 的 程序 中 大 量 使 用 的 是 顺序 结构 ,也 就 是 说 ,程序 大 部 分 情况 下 是 顺序 执行 的 ,发 生 转 
移 和 过 程 调用 的 情况 相对 较 少 。 尤 其 是 现代 程序 的 编制 吕 调 程序 的 模块 化 ,注重 程序 的 规 
整 性 和 结构 化 。 例 如 ,从 20 世纪 70 年 代 开 始 出 现 的 PASCAL 语言 就 是 一 个 典型 的 模块 化 
语言 , 它 强 烈 建 议程 序 员 尽 可 能 少 地 使 用 goto 语句 。 有 和 再 如 ,C 语言 是 一 个 因数 化 语言 
基本 组 成 就 是 图 数 , 而 吨 数 可 以 看 成 一 个 个 程序 模块 。 当 CPU 在 某 一 段 时 间 内 执行 程序 
的 一 个 小 的 模块 时 ,CPU 对 程序 的 访问 往往 就 局 限 在 这 一 模块 所 分 布 的 局 部 存储 空间 内 ， 
加 之 程序 中 大 量 使 用 循环 ,使 程序 的 执行 更 有 局 部 性 倾 问 。 虽 然 程 序 中 不 可 避免 要 使 用 分 
支 转移 ,但 一 方面 这 种 转移 情况 相对 较 少 , 男 一 方面 ,即使 发 生 了 转移 ,程序 又 将 进入 男 一 模 
块 进行 局 部 性 访问 。 

当 一 个 程序 执行 时 ,是 由 操作 系统 将 其 从 计算 机 辅 存 中 调 人 主 存 中 的 。 操 作 系统 在 为 
程序 分 配 主 存 空间 时 ,是 尽 可 能 为 程序 分 配 连续 的 存储 空间 。 这 样 就 使 得 程序 在 存储 冀 中 
的 存放 顺序 与 其 编写 顺序 相 一 致 ,这 也 就 进一步 保证 了 CPU 对 程序 访问 的 局 部 性 。 


2. cache 的 基本 思想 和 工作 原理 


在 前 面 4. 1.3 市 介绍 存储 系统 的 层次 结构 时 讲 到 ,现代 存储 冀 为 了 满足 用 户 对 存储 癌 
高 速度 ,大 容量 和 低 价格 的 要 求 ,普遍 采用 了 cache- 主 存 - 辅 存 这 样 一 种 结构 。 实 际 上 ,这 里 
面包 括 了 两 种 实现 不 同 目 标的 层次 结构 ; 一 是 “cache- 主 存 ” 构 ,使 用 融 速 绥 冲 存储 冀 提 融 
CPU 的 访 存 速度 ; 二 是 “ 主 存 - 辅 存 ”结构 ,使 用 虚拟 存储 各 管 理 为 用 户 提 供 一 个 大 容量 的 程 
序 空间 。 

实现 cache 的 基本 思想 基于 的 就 是 程序 的 局 部 性 原理 : 在 CPU 与 主 存 之 间 设 置 一 个 
小 容量 的 高 速 缓冲 存储 需 cache, 当 一 个 程序 调和 人 主 存 运行 时 ,将 该 程序 当前 要 执行 的 指令 
及 其 后 将 执行 的 一 部 分 指令 同时 调 入 cache 中 ,CPU 每 次 首先 从 cache 中 取 指 令 执 行 , 根 据 
程序 的 局 部 性 原理 ,CPU 大 部 分 情况 下 可 以 在 cache 中 取 到 指令 ( 称 为 命中 ), 只 要 命中 率 
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中 


哆 高 ,就 可 以 使 得 CPU 访 存 的 速度 接近 于 访 cache 的 速度 。 
下 面 通 过 图 4-26 进一步 阐述 cache 的 工作 原理 。 


指令 或 数据 读 出 送 CPU 


图 4-26 ”cache 工作 原理 


CPU 的 访 存 地 址 ( 主 存 地 址 ) 首 先 通 过 一 个 主 存 -cache 的 地 址 映射 机 构 转 换 成 一 个 访 
cache 的 地 址 。 如 果 CPU 要 访问 的 这 一 单元 内 容 已 经 在 cache 中 , 则 本 次 访 cache 命中 ,于 
是 从 cache 中 将 该 单元 的 内 容 恋 出 ,并 送 CPU; 奋 CPU 要 访问 的 这 一 单元 不 在 cache 中 ， 
则 本 次 访 cache 不 命中 ,于 是 使 用 CPU 的 访 存 地 址 直接 访问 主 存 , 从 主 存 中 将 该 单元 的 内 
容 读 出 ,并 送 CPU ,从 而 完成 了 一 次 CPU 的 访 存 操作 。 在 cache 存储 着 组 织 中 ,cache 和 主 
人 存 都 按 块 进行 组 织 , 每 一 个 块 由 奢 干 个 衬 单 元 组 成 , 且 主 存 的 块 和 cache 的 块 大 小 相同 。 在 
不 命中 的 情况 下 ,CPU 访 存 结束 后 ,还 需 将 本 次 所 访问 的 单元 所 在 主 存 的 块 的 全 部 单元 内 
容 调 人 cache 中 。 夺 当前 cache 已 满 , 则 需 将 cache 中 的 一 个 旧 块 蔡 换 出 来 。 

对 以 上 cache 工作 原理 图 进行 进一步 分 析 会 发 现 ,CPU 无 论 是 命中 而 访 cache 还 是 未 
命中 而 访 主 存 , 都 需要 首先 使 用 访 主 存 地 址 进行 一 次 地 址 映射 操作 ,地 址 映射 的 目的 是 将 
CPU 来 的 访 主 存 地 址 转换 成 一 个 访 cache 地 址 ,同时 通过 地 址 映射 能 够 判断 本 次 要 访问 的 
主 存 地 址 字音 元 是 否 已 经 在 cache 中 。 这 就 市 来 了 一 个 问题 , 那 就 是 CPU 无 论 是 访 cache 
还 是 访 主 存 之 前 不 是 又 额外 增加 了 一 个 操作 吗 ? 这 增加 的 额外 操作 会 不 会 增加 CPU 访 丰 
的 时 间 呢 ? 确实 ,地 址 映射 是 实现 cache 额外 增加 的 操作 ,但 是 ,为 了 不 影响 CPU 的 访 存 速 
度 ,地 址 映射 是 通过 使 用 一 个 称 为 相 联 存储 名 的 高 速 章 件 完 成 的 。 

前 面 所 介绍 的 存储 器 (半导体 RAM 或 ROM 等 ) 都 是 按 地 址 访问 的 存储 器 ,也 就 是 说 ， 
CPU 通过 给 出 一 个 存储 单元 的 地 址 对 选中 的 存储 单元 的 内 容 进 行 读 瑟 操 作 。 而 相 联 和 存储 
仙 则 不 同 , 它 是 按 内 容 访 问 的 存储 器 。 具 体 来 说 就 是 ,把 存储 单元 中 的 内 容 的 一 部 分 或 全 部 
作为 关键 字 ,去 检索 整个 存储 需 ,然后 对 与 检索 关键 字 相 符 的 存储 单元 进行 读 与 操作 。 

相 联 和 存储 右 的 组 成 原理 图 如 图 4-27 所 示 。 它 主要 由 数据 寄存 顺 、 屏 蔽 寄存 姑 、 输 出 寄 
存 融 、 匹 配 寄 存 前 、 存储 体 和 比较 逻辑 等 组 成 。 
数据 寄存 冀 用 来 存放 要 按 内 容 检索 的 关键 字 , 其 位 数 


和 相 联 存储 天 的 存储 单元 位 数 


屏蔽 寄存 器 用 来 存放 屏蔽 码 ,屏蔽 码 用 于 控制 数据 寄存 器 中 哪些 位 参与 检索 比较 (0 屏 
藤 ,1 开放 ) ,其 位 数 和 数据 寄存 器 位 数 相同 。 
给 出 寄存 器 用 来 存放 按 数据 寄存 器 中 的 关 名 


字 检 索 所 得 到 的 比较 相符 的 单元 内 容 , 其 
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位 数 和 数据 寄存 大 位 数 相同 。 


效 撕 
0000 1101 


数据 \ 效 据 奇 仔 耕 00 | 1000 0000 | 1 


UU10 110] 
读 / 写 


1001 1000 


| 1010 1101 |1 
| 100 1000 


比较 逻辑 四 001 1010 1100 0010 | 。 
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建 字 检 索 比 较 相 符 的 单元 标志 ,其 位 数 等 于 
的 存储 单元 数 , 比 较 相 符 的 单元 在 匹配 寄存 熏 的 相应 位 被 标识 为 1。 

为 了 说 明 问题 ， 假设 一 个 相 联 存储 各 的 存储 体 由 8 个 字 单 元 构成 ,每 个 字 单 元 为 16 位。 

诸 体 的 每 个 字 单 元 除了 存储 一 个 16 位 字 外 ,还 设 有 一 个 标志 位 V, 用 于 指明 该 单元 的 数 
有 效 ,1 为 有 效 ,0 为 无 效 。 

当 CPU 访问 相 联 存储 种 时 ,首先 将 一 个 要 按 内 容 检索 的 关键 字 送 相 联 存储 天 的 数据 
寄存 带 ,然后 再 送 一 个 屏蔽 字 到 屏蔽 寄存 冀 。 例 如 ,假设 CPU 要 检索 在 存储 大 中 是 否 有 高 
4 位 为 1010 的 单元 , 则 CPU 将 一 个 关键 宇 1010 xxxx xxxx xxxx 送 相 联 存 储 器 的 数据 寄存 

是 ,然后 民 蔽 字 1111 0000 0000 0000 到 屏蔽 寄存 舌 。 于 是 , 相 联 存储 郑 开 始 将 所 
有 有 标志 位 V 为 1 ev 4 位 同时 与 数据 寄存 器 中 的 1010 进行 比较 ,车 有 相符 者 , 则 将 
匹配 寄存 冀 与 比较 相符 的 单元 相对 应 的 位 置 1, 并 同时 把 相符 的 单元 内 容 读 出 到 输出 寄存 
化 中 。 至 此 ,CPU 的 一 次 访 相 联 存储 甫 操作 结束 。 

值得 注意 的 是 , 相 联 存储 幕 的 比较 是 所 有 单元 同时 进行 的 ,而 且 是 全 人 刹 件 实现 ,因此 ,这 
种 操作 速度 快 。 对 于 cache 实现 来 说 ,通过 相 联 存储 带 完 成 地 址 映射 ,额外 增加 的 时 间 是 非 
第 少 的 。 


4.4.2 主 存 与 cache 的 地 址 映射 


CPU 对 存储 前 的 访问 , 通 币 是 一 次 谈 写 一 个 字 单 元 。 当 CPU 访 cache 不 命中 时 , 需 
存储 在 主 存 中 的 字 单 元 连同 其 后 右 十 个 字 一 同调 入 cache 中 ,之 所 以 这 样 做 ， 是 为 了 使 其 后 
的 访 存 能 在 cache 中 命中 。 因 此 ， es cache 之 间 一 次 交换 的 数据 单位 应 该 是 一 个 数据 
。 数据 块 的 大 小 是 固定 的 ,由 若干 个 字 组 成 , 且 主 存 和 cache 的 数据 块 大 小 是 相同 的 。 

从 cache- 主 存 层次 实现 的 目标 看 ， ee CPU 的 访 存 速度 接近 于 访 cache 的 速 
度 , 另 一 方面 为 用 户 程序 提供 的 运行 空间 应 保持 为 主 存 容 量 大 小 的 存储 空间 。 在 采用 


匹 人 的 关 避 
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cache- 主 存 层次 的 系统 中 ,cache 对 用 户 程 序 而 言 是 透明 的 ,也 就 是 说 ,用 户 程序 可 以 不 需要 
知道 cache 的 存在 。 因 此 ,CPU 每 次 访 存 时 ,依然 和 未 使 用 cache 的 情况 一 样 ,给 出 的 是 一 
个 主 存 地 址 。 但 在 cache- 主 存 层次 中 ,CPU 首先 访问 的 是 cache, 并 不 是 主 存 。 为 此 ,需要 
一 种 机 制 将 CPU 的 访 主 存 地 址 转换 成 访 cache 地 址 。 而 主 存 地 址 与 cache 地 址 之 间 的 转换 
是 与 主 存 块 及 cache 块 之 间 的 映 冉 关系 紧密 联系 的 ,也 就 是 说 , 当 CPU 访 cache 未 命中 时 ， 
需要 将 欲 访 问 的 字 所 在 主 存 中 的 块 调 入 cache 中 , 按 什么 样 的 策略 调 入 ,和 直接 影 啊 到 主 存 地 
址 与 cache 地 址 的 对 应 关系 ,这 也 就 是 本 小 廊 要 解决 的 主 存 与 cache 的 地 址 映射 问题 。 
主要 有 三 种 地 址 映射 方式 ,分 别 为 全 相 联 映射 .直接 相 联 映射 和 组 相 联 映射 。 


1. 全 相 联 映射 


全 相 联 映射 是 指 主 存 中 任意 一 块 都 可 以 映射 到 cache 中 任意 一 块 的 方式 ,也 就 是 说 , 当 
主 存 中 的 一 块 需 调 人 cache 时 ,可 根据 当时 cache 的 块 占用 或 分 配 情 况 ,选择 

块 存储 ,所 选 的 cache 块 可 以 是 cache 中 的 任意 一 块 。 例 如 , 设 cache 共有 2° 块 , 主 存 共有 
2* 块 ,当主 存 的 某 一 块 j 需 调 进 cache 中 时 , 它 可 以 存 人 cache 的 块 0、 块 1、…、 块 i、…., 块 
2" 一 1 的 任意 一 块 上 ,如 图 4-28 所 示 。 


cache 


在 全 相 联 映射 方式 下 ,CPU 的 访 主 存 地 址 如 图 4-29 所 示 。 
其 中 ,M 为 主 存 的 块 号 ,W 为 块 内 的 字号 。 而 CPU 访 cache 的 地 址 如 图 4-30 所 示 。 
其 中 ,C 为 cache 的 块 号 ,W 为 块 内 的 字号 。 


ML | w_ 


图 4-29 CPU 的 访 存 形式 图 4-30 CPU 访 cache 的 地 址 形式 


主 存 地 址 到 cache 地 址 的 转换 是 通过 查找 一 个 由 相 联 存 储 器 实现 的 块 表 来 
形成 过 程 如 图 4-31 所 示 。 
当 一 个 主 存 块 调 入 cache 中 时 ,会 同时 在 一 个 存储 主 存 块 号 和 cache 块 号 映射 表 的 相 联 
器 中 进行 登记 。CPU 访 存 时 ,首先 ,根据 主 存 地 址 中 的 主 存 块 号 M 在 相 联 存储 器 中 碍 
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主 存 块 与 cache 块 与 
全 相 联 映射 的 地 址 转换 


找 cache 块 号 , 右 找 到 , 则 本 次 访 cache 命中 ,于 是 将 对 应 的 cache 块 号 取出 ,并 送 访 cache 
地 址 的 块 号 C 字段 ; 楷 接 看 将 主 存 地 址 的 块 内 字号 殉 和 直接 送 至 cache 地 址 的 块 内 字号 W 
字段 ,从 而 形成 一 个 访 cache 的 地 址 ; 最 后 根据 该 地 址 完成 对 cache 单元 的 访问 。 

全 相 联 映射 方式 的 优点 是 cache 的 空间 利用 认 高 ,但 缺点 是 相 联 和 存储 冀 庞 大 ,比较 电路 
复杂 ,因此 只 适合 于 小 容量 的 cache 使 用 。 


2. 直接 相 联 映射 


百 接 相 联 映 射 方式 ( 见 图 4-32) 是 指 主 存 的 某 块 7 只 能 映射 到 满足 以 下 特定 关系 的 
cache 块 i 中 ， 
(4. 2) 


图 4-32 ”直接 相 联 映射 方式 


4-32 中 , 主 存 的 第 0. 2 .2 、 2” : 块 只 能 映射 到 cache 的 第 0 块 , 主 存 的 第 1、 第 
25 十 1 ,第 25+1 十 1 、2Y-1 块 只 能 映射 到 cache 的 第 1 块 ,…, 主 存 的 第 25 一 1、25+1 一 1、…、 
2 一 1 块 日 能 映射 到 cache 的 第 2 一 1 块 ， 

在 直接 相 联 映射 方式 下 ,CPU 的 访 主 存 地 址 如 
图 4-33 所 示 。 图 4-33 CPU 的 访 主 存 地 址 形式 
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其 中 ,T 为 标志 号 ,C 为 cache 的 块 号 ,W 为 块 内 的 字号 。 在 这 里 , 原 主 存 的 块 号 M 实 
际 上 被 分 成 了 两 个 字段 : TT 和 C, 其 中 C 用 于 指出 主 存 的 块 可 以 映射 的 cache 的 块 。 一 般 来 
讲 , 主 存 的 块 数 是 cache 的 块 数 的 整数 们 ,也 就 是 说 主 存 的 块 数 2 和 cache 的 块 数 2° 满 足 关 
系 式 : 


2 "一 2472 
在 直接 相 联 映射 方式 下 ,标志 号 工 是 随 cache 的 每 个 块 一 起 存 
4-34 所 未 。 


储 的 ,其 地 址 转换 过 程 如 


主 存 地 址 
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当 一 个 主 存 块 调 人 cache 中 时 ,会 同时 将 主 存 地 址 的 开标 志和 存 人 cache 块 的 标志 字段 
中 。 当 CPU 送 来 一 个 访 存 地 址 时 ,首先 ,根据 该 主 存 地 址 的 C 字段 找到 cache 的 相应 块 , 然 
后 将 该 块 标志 字段 中 存放 的 标志 与 主 存 地 址 的 工 标志 进行 比较 , 奋 相 符 , 说 明 主 存 的 块 目 
前 已 调 入 该 cache 块 中 , 则 命中 ,于 是 使 用 主 存 地 址 的 W 字段 访问 该 cache 块 的 相应 字 单 
元 ; 硅 不 相符 , 则 未 命中 ,于 是 使 用 主 存 地 址 下 接 访 主 存 。 

耳 接 相 联 映射 方式 的 优点 是 比较 电路 最 简单 ,但 缺点 是 cache 块 冲突 率 较 局 ,从 而 降低 
J cache 的 利用 率 。 由 于 主 存 的 每 一 块 只 能 映射 到 cache 的 一 个 特定 块 上 ,当主 存 的 茶 块 需 
调 入 cache 时 ,如 条 对 应 的 cache 特定 块 已 被 占用 ,而 cache 中 的 其 他 块 即使 空闲 ,主人 存 的 块 
也 只 能 通过 符 换 的 方式 调和 人 特定 块 的 位 置 ,不 能 放置 到 其 他 块 的 位 置 上 。 


图 4-34 ”直接 相 联 映射 的 地 址 转换 


3. 组 相 联 映射 


以 上 两 种 方式 各 有 优 缺 点 ,而 且 非 常 有 趣 的 是 ,它们 的 优 缺 点 正好 相反 ,也 就 是 说 ,对 于 
全 相 联 映射 方式 来 说 为 优点 的 恰 是 直接 相 联 映射 方式 的 缺点 ,而 对 于 全 相 联 映射 方式 来 说 
为 缺点 的 恰 是 直接 相 联 映射 方式 的 优点 。 那 么 ,可 否 找 到 一 种 能 较 好 地 兼顾 这 两 种 方式 的 
优点 的 映射 方式 呢 ? 下 面 就 来 看 看 组 相 联 映 射 方式 。 

在 这 种 方式 下 ,将 cache 分 成 2* 组 ,每 组 包含 2* 块 。 主 存 的 块 与 cache 的 组 之 间 采 用 下 
接 相 联 映射 ,而 与 组 内 的 各 块 则 采用 全 相 联 映射 。 也 就 是 说 , 主 存 的 某 块 只 能 映射 到 cache 
的 特定 组 中 的 任意 一 块 。 主 存 的 菜 块 j 与 cache 的 组 & 之 间 满 足以 下 关系 : 

Ko=jmody2’ (4. 3) 
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设 主 存 共有 2:X2* 块 ( 即 M 一 s* 十 xz , 则 它们 的 映射 关系 如 图 4-35 所 示 。 


引 2 下 ] | 


图 4-35 ”组 相 联 映射 方式 


图 4-35 中 , 主 存 的 块 0、2*、2*T、… (2 一 1)22 可 以 有 映射 到 cache 的 第 0 组 的 任意 一 块 ， 
主 存 的 块 1、 2 十 1、 2 十 1 、 (2 一 1)2 十 1 可 以 映射 到 cache 的 第 1 组 的 任意 一 
块 ,……:, 主 存 的 块 2 一 1 21 一 1] 、…、2M 一 1] 可 以 映射 到 cache 的 第 2 一 1 组 的 任意 一 块 。 

在 组 相 联 映射 方式 下 ,CPU 的 访 主 存 地 址 和 访 cache 地 址 如 图 4-36 所 示 。 

其 中 ,x 为 cache 的 组 号 ,v 为 组 内 的 块 号 。cache 
的 块 号 C 二 ww 十 v, 而 主 存 的 块 号 M 二 s 十 wu。 也 就 是 说 ， 下 
主 存 块 地 址 的 后 位 指出 了 主 存 的 这 一 块 所 能 映射 的 
cache 的 组 。 

与 全 相 联 映射 方式 类 似 的 是 ,在 组 相 联 映射 方式 ”图 4-36 CPU 的 访 主 存 地 址 形式 和 
下 , 主 存 地址 到 cache 地 址 的 转换 也 是 通过 查找 一 个 机 
由 相 联 存储 着 实现 的 块 表 来 完成 的 ,其 形成 过 程 如 
图 4-37 所 示 。 

当 一 个 主 存 块 调 人 cache 中 时 ,会 同时 将 其 主 存 块 地 址 的 前 位 写 人 一 个 由 相 联 存储 
从 实现 的 快 表 的 对 应 cache 块 项 的 字段 中 。 例 如 , 设 主 存 的 某 块 调 人 cache 的 第 1 组 的 第 
2 块 中 , 则 在 快 表 的 组 1 第 3 项 的 :字段 会 登记 下 该 主 存 块 地 址 的 前 s 位 。 

CPU 访 存 时 ,首先 根据 主 存 地 址 中 的 主 存 块 号 中 的 字段 找到 快 表 的 相应 组 ,然后 将 
该 组 的 所 有 项 的 前 位 同时 与 主 存 地 址 的 * 字段 作 比 较 , 硅 相符 , 则 说 明 主 存 块 在 cache 中 ， 
于 是 将 cache 中 该 项 的 v 字 有 段 取 出 ,作为 cache 地 址 的 vv 字段 ,而 cache 地 址 的 wu、W 字段 直 
接 由 主 存 地 址 的 ww、W 字段 形成 ,最 后 形成 一 个 完整 的 访 cache 地 址 。 当 然 , 奢 比较 结果 没 
有 相符 项 , 则 未 命中 ,由 主 存 地 址 耻 接 访 主 存 。 

有 其实, 全 相 联 映射 和 直接 相 联 映射 可 以 看 成 组 相 联 映 射 的 两 个 极端 情况 。 寿 4 二 0,v 一 
C, 则 cache 只 包含 1 组 ,此 即 全 相 联 映射 方式 ; 硅 4 一 C,v 王 0, 则 组 内 的 块 数 等 于 1, 此 即 耳 
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接 相 联 映射 。 

在 实际 应 用 中 , 相 联 映 射 方式 每 组 的 块 数 一 般 取信 较 小 ,典型 全 为 2.4.8、16 等 ,分 别称 
为 两 路 组 相 联 .四 路 组 相 联 等 。 这 样 一 aa 实现 较 容 多 ,例如 ,两 路 
组 相 联 灯 用 两 路 比较 ， 四 路 组 相 联 包 用 四 路 比较 于 一 方面 ,cache 每 组 增加 的 可 映射 块 
归口 有 效 减 少 冲 突 , 提 融 cache 访问 的 命中 率 。 


蔡 换算 法 


当 CPU 访 cache 发 生 不 命中 的 情况 时 ,就 直接 访 主 存 ,并 同时 将 所 访问 单元 所 在 的 一 
个 主 存 块 一 并 调 人 cache 中 。 如 果 此 时 该 主 存 块 在 cache 中 的 所 有 特定 位 置 已 被 其 他 块 所 
占用 , 则 需 进 行 蔡 换 ， TA 个 老 的 主 存 块 从 cache 中 调 出 ,将 新 的 主 存 块 
调 入 cache。 顽 的 特 换 对 于 直接 相 联 映射 方式 来 说 是 最 简单 的 ,因为 在 直接 相 联 映射 方式 
下 , 主 存 的 任意 一 块 只 能 映射 到 cache 的 一 个 特定 块 上 ,因此 , 当 需 要 进行 将 换 时 ,只 需 将 
cache 中 的 特定 块 蔡 换 出 去 即 js 而 对 于 全 相 联 映射 和 组 相 联 映射 方式 ,情况 则 没 这 人 么 简 
单 ,需要 采取 一 定 的 替换 策略 或 算法 进行 选择 ,主要 有 以 下 几 种 蔡 换 算法 

随机 法 : 每 次 随机 选择 一 个 主 存 块 蔡 换 出 去 。 这 种 算法 不 考虑 各 块 的 使 用 情况 ,在 可 
蔡 换 特定 块 数 少 的 情况 下 容易 造成 将 需 使 用 的 块 蔡 换 出 去 ,从 而 使 cache 的 命中 率 会 有 所 
降低 。 

先进 先 出 (FIFO) 法 : 每 次 将 最 先 调 人 cache 的 主 存 块 替换 出 去 。 该 算法 记录 每 个 块 的 
调 入 时 间 , 当 要 发 生 蔡 换 时 ,从 所 有 可 能 被 蔡 换 的 主 存 块 中 选择 一 个 最 先 调 人 cache 的 块 特 
换 出 去 。 该 算法 实现 较 容 易 , 系 统 开 销 较 小 ,但 并 不 十 分 符合 主 存 块 在 cache 中 的 使 用 规 
律 ,有 可 能 造成 正 需 使 用 的 块 被 调 出 ,从 而 影响 cache 的 命中 率 。 

最 不 经 第 使 用 (LFU) 算 法 . 每 次 将 cache 中 访问 最 少 的 块 在 换 出 去 。 这 种 算法 为 每 个 
块 设置 一 个 计算 各 ,从 0 开始 计数 ,每 被 命中 一 次 计数 冀 增 1。 当 需要 和 蔡 换 时 ,从 所 有 可 能 
被 蔡 换 的 主 存 块 中 选择 一 个 计数 器 值 最 小 的 块 (最 不 经 党 使用) 替换 出 去 。 这 种 算法 将 计数 
周期 限定 在 对 这 些 特定 块 两 次 疹 换 之 间 的 间 隅 时间 内 ,因而 不 能 严格 反映 近期 块 使 用 的 
情况 。 


4.4.3 
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近期 最 少 使 用 (LRU) 算 法 : 每 次 次 将 近期 最 少 使 用 的 主 丰 类 督 换 出 去 。 该 算法 在 实现 
时 ,为 每 个 调 人 cache 区 改天 ,一 个 块 每 命中 一 次 ,其 计数 需 清 和 雪 ,同时 将 
其 他 块 的 计数 天 增 1。 当 需要 和 替换 时 ， Mie 可 | 能 被 蔡 换 的 主 存 块 中 选择 一 个 计数 送 什 最 
大 的 块 ( 该 块 近期 最 少 使 用 ) 替 换 出 去 。 这 种 算法 符合 cache 的 工作 原理 ,可 使 cache 具有 较 
局 的 命中 率 。 

对 两 路 组 相 联 cache 来 说 ,LRU 算法 的 实现 可 以 简化 。 因 为 在 两 路 组 相 联 cache 中 ,一 个 
主 存 块 只 能 调 入 cache 的 一 个 特定 组 的 两 块 中 的 一 块 ,因此 只 需 设 置 一 个 标志 位 , 当 两 块 中 的 
一 块 (假设 为 A 块 ) 被 命中 时 ,标志 位 置 1 ,而 为 一 块 (假设 为 B 块 ) 被 合 中 时 ,标志 位 清 0。 当 
需要 符 换 时 , 置 需 检 查 此 标志 位 的 状态 即 可 : 为 0 蔡 换 A 块 ,为 1 符 换 日 块 。Pentium CPU 
内 的 数据 cache 采用 的 是 一 个 两 路 组 相 联 结构 ,使 用 的 就 是 这 种 简化 的 LRU 符 换 算法 。 

下 面 以 图 4-38 的 例子 ,简单 说 明 FIFO 和 LRU 替换 算法 的 工作 原理 和 命中 率 情况 。 


页 地 址 流 | 2 5 3 4 
FIFO) 
替换 算法 1 1 |1l 
3 页 /组 
命中 命中 率 3/12 
LRU 所 1 
家 换 异 法 1 
3 页 /组 四 
布 中 命中 率 2/12 
页 地 址 流 
FIF() 
蔡 换 算法 二 
4 页 /组 
命中 率 2/12 
LRLU 
符 换算 法 
4 页 /组 加 四 


命中 :; 命中 命中 : 命中 率 4/12 
图 4-38 ”FIFO 和 LRU 替换 算法 的 命中 率 情况 


从 上 面 的 例子 可 以 看 出 ,LRU 算法 的 平均 命中 率 要 高 于 FIFO 算法 ,而 且 随 着 分 组 容 
量 的 增 大 ,LRU 算法 的 命中 率 必 定 提高 ,FIFO 算法 则 未 必 。 因 为 在 LRU 算法 中 ,同一 时 
刻 小 容量 分 组 之 页 的 集合 必定 是 大 容量 分 组 之 页 的 集合 的 子 集 , 因 而 小 容量 分 组 的 命中 点 
必定 还 是 大 容量 分 组 的 命中 点 ,这 种 特征 算法 称 为 堆栈 算法 ,而 在 FIFO 算法 中 ,同一 时 刻 
小 容量 分 组 之 页 的 集合 则 不 一 定 是 大 容量 分 组 之 页 的 集合 的 子 集 。 


4.4.4 cache 的 与 策略 
cache 中 的 内 容 可 以 看 成 主 存 的 一 个 子 集 , 即 每 次 总 是 将 主 存 的 部 分 块 的 内 容 调 人 
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cache 中 。CPU 对 cache 的 读 操 作 是 不 会 影 啊 cache 的 内 容 的 ,也 就 不 会 影 啊 cache 与 主 存 

内 容 的 一 致 性 。 但 写 就 不 一 样 了 , 当 CPU 对 cache 的 某 块 进行 了 一 次 写 操 作 , 但 对 主 存 该 

块 的 内 容 却 没有 同时 进行 写 时 ,会 造成 主 存 和 cache 内 容 的 不 一 致 。 因 此 ,对 cache 的 写 需 
玉 取 东 种 策略 或 方法 。 

全 写法 (Write-Through): 又 称 写 直达 法 ,CPU 每 次 在 写 cache 命中 时 ,在 写 cache 的 
同时 ,也 对 相应 的 主 存 块 进行 写 入 ; 当 写 cache 未 命中 时 , 则 直接 写 主 存 。 全 写法 是 写 
cache 和 写 主 存 同步 进行 的 ,其 优点 是 cache 和 主 存 的 内 容 能 保持 高 度 的 一 致 性 ,缺点 是 
cache 对 CPU 的 写 操作 起 不 到 高 速 缓存 的 作用 ,失去 了 cache 的 功效 。 统 计 表 明 ,一 般 程序 
中 的 写 操作 占 到 了 存储 器 操作 的 15% 左 右 ,对 于 一 些 特殊 应 用 的 程序 ,其 写 操作 比例 会 更 
高 。 在 这 种 情况 下 ,来 用 全 写法 实现 写 操 作 会 影 啊 cache 的 效率 。 

写 回 法 (Write-Back) : CPU 每 次 在 写 cache 命中 时 ,只 写 cache, 暂 不 写 主 存 ;只 有 当 某 
被 写 命中 的 块 从 cache 中 替换 出 去 时 才 写 回 主 存 。 这 种 方法 使 cache 在 CPU 的 写 操作 中 也 
同样 能 发 挥 高 速 缓存 的 作用 ,但 却 存在 主 存 与 cache 内 容 不 一 致 的 隐患 。 与 1 


| 


为 每 个 cache 块 设置 一 个 标志 位 ,以 反映 cache 的 某 块 是 否 被 修改 过 。 当 某 块 被 蔡 - 
时 ,根据 标志 位 决定 在 蔡 换 的 同时 是 否 进 行 回 写 操作 ，。 未 被 修改 过 的 块 在 蔡 换 出 去 有 
进行 回 写 ,只 有 被 修改 过 的 块 在 蔡 换 出 去 时 , 才 需 进行 主 存 的 回 写 。 

现在 越 来 越 多 的 机 融和 都 采用 了 二 级 cache, 在 处 理 写 操 作 时 需要 考虑 的 不 仅仅 是 写 回 主 
存 , 还 需 考 虑 写 回 二 级 cache。 写 一 次 法 (Write One Time) 是 采用 了 二 级 cache 的 机 器 中 篆 
用 的 写 操作 策略 ,其 具体 方法 是 : 写 命 中 时 的 处 理 方法 和 写 回 法 基本 相同 ,只 是 第 一 次 写 命 
中 时 要 同时 写 人 主 存 和 其 他 二 级 cache 等 。 奔 腾 CPU 的 片 内 数据 cache 就 米 用 了 这 一 
方法 ， 


4.4.5 cache 性 能 分 析 
1. CPU 访 存 时 间 的 分 析 


在 CPU 与 主 存 之 间 增 加 cache 的 目的 ,就 是 要 使 CPU 的 访 存 速度 接近 于 访 cache 的 速 
度 。 那 么 ,在 怎样 的 情况 下 能 做 到 这 一 点 呢 ? 下 面 进行 一 下 分 析 。 

退 N, 表示 某 一 段 时 间 cache 完成 存 取 的 总 次 次 数 ， N, 表示 这 一 一 上 段 时 间 主 存 完成 存 取 的 忆 
次 数 ,定义 为 命中 率 , 则 有 


NN ee 
h N+N- (4. 4) 
再 假设 T. 为 cache 存储 天 的 谈 与 周期 时 间 ,也 为 主 存 储 船 的 谈 写 周期 时 间 , 则 cache- 


统 的 平均 访问 时 间 Th 为 


A 一 AL 十 (一 A) (4. 5 ) 
从 云 (4.5) 可 以 看 出 ,平均 访问 时 间 与 命中 率 是 楷 密 相关 的 ,命中 诗 越 高 ,平均 访问 时 间 
越 接 近 cache 的 读 写 周期 时 间 ，。 
系统 的 目标 是 以 较 小 的 硬件 代价 使 得 cache- 主 存 系统 的 平均 访问 时 间 Ts。 越 接 近 T.，。 
设 r 二 TT,/T. 表 示 主 存 慢 于 cache 的 倍率 , 则 cache- 主 存 系 统 访问 效率 e@ 2 
一 二 一 上 ] 
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【 例 4.3】 设 CPU 执行 某 一 段 程序 时 共 进 行 了 10 000 次 的 访 存 操作 ,其 中 命中 cache 
并 完成 访 cache 的 操作 共 9800 次 ,而 未 命中 访 主 存 的 次 数 为 200 次 ,已 知 cache 的 讯 写 周期 
为 20ns, 主 存 的 读 写 周期 为 80ns, 求 执行 这 一 段 程序 时 该 cache- 主 存 系 统 的 平均 访问 时 间 。 
解 : 信 中 3 的 平均 访问 时 间 为 


家 有 二 9800/10 000 王 0. 98, 则 cache- 主 存 系 统 
I, =hil. TT (le pi, 
一 0.98X20 十 (1 一 0.98) Xx 80 
=2].2(ns) 
表 4-1 列 出 的 是 T. 二 10ns,T 二 60ns 时 ,不 同仁 所 对 应 的 平均 访问 时 间 工 ,不同 。 


2. 块 的 大 小 


主 存 和 cache 都 划分 了 同样 大 小 的 块 , 当 CPU 访问 
cache 失效 时 , 需 将 一 个 主 存 块 调 人 cache。 那 么 ,一 个 
块 的 容量 该 多 大 算 合 适 呢 ? 显然 , 当 块 容量 从 很 小 逐渐 
变 大 时 ,会 使 cache 的 命中 认 增 加 。 这 是 因为 , 当 CPU 
所 访问 的 一 个 字 单 元 不 在 cache 中 时 ,会 从 主 存 中 将 该 
单元 以 及 与 前 后 硅 干 单元 组 成 的 块 一 并 调 入 主 存 , 块 越 
大 ,CPU 访问 完 该 单元 后 再 访问 其 他 单元 的 命中 率 自 然 
就 会 高 。 但 随 着 块 容量 的 继续 增 大 ,对 命中 率 增 加 的 贡 
献 将 会 越 来 越 小 。 因 为 随 看 块 的 增 大 , 离 本 次 访问 未 命 

元 越 来 越 远 的 一 些 字 单元 也 被 调 人 cache ,而 这 


h 
0.0 
0.1 
0.2 
0.3 
0.4 
0.5 
0.6 
QO. 
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1. 0 


表 4-1 命中 率 和 平均 访问 时 间 


Ta 
bOns 
Dons 
oo0ns 
4ons 
40ns 
35ns 
30ns 
2ons 
20ns 
l5ns 
10ns 


些 单元 与 刚 访问 过 的 单元 并 不 在 一 个 程序 空间 的 “局 
部 ”, 也 就 是 说 不 会 在 同一 个 块 中 访问 到 它们 ,它们 本 次 调 入 的 意义 不 大 。 

块 的 容量 大 小 与 命中 率 的 关系 是 比较 复杂 的 , 它 取决 于 不 同 程序 的 局 部 性 特征 ,对 所 有 
程序 而 言 ,很 难 确定 一 个 最 优 的 块 的 大 小 。 通 常 认为 块 容量 大 小 在 8 一 64B 是 比较 合适 的 ， 


3，cache 的 数量 


最 初 构建 主 存 -cache 层次 时 ,只 设置 了 一 个 cache。 而 近 些 年 来 , 越 来 越 多 的 机 带 采 用 
了 多 级 cache 和 指令 缓存 与 数据 缓存 分 离 等 技术 ,进一步 提 局 了 CPU 的 访 存 效率 。 

随 着 集成 度 的 提高 ,现代 的 CPU 在 必 片 中 集成 了 一 个 小 容量 的 cache, 与 CPU 外 部 的 
cache 一 起 构成 二 级 cache 系统 ,: 
为 第 2 级 (L2) 。 一 般 来 讲 ,L1 cache 比 L2 cache 容量 更 小 ,速度 更 快 。“L1 cache-L2 cache- 
主 存 ”这 种 层次 从 工作 原理 上 讲 与 前 述 的 cache 工作 原理 是 完全 相同 的 , 即 CPU 首先 访 L1 
级 cache, 寿 不 命中 ,再 访问 L2 级 cache 和 主 存 。 

与 通过 外 部 总 线 连接 的 外 部 cache 相 比 ,CPU 的 片 内 cache 与 CPU 的 路 径 更 短 , 可 减 
少 处 理 器 在 外 部 总 线 上 的 操作 时 间 ,因而 加 快 了 CPU 的 访 存 速度 ,进一步 提高 了 系统 的 
性 能 。 

近 些 年 来 ,对 cache 系统 设计 的 为 一 种 趋势 是 灯 用 分 立 cache 技术 ,也 就 是 将 指令 和 数 
据 分 开 , 分 别 存放 在 指令 cache 和 数据 cache 中 。 这 种 分 立 cache 技术 有 利于 CPU 采用 流 
水 线 方式 执行 指令 。 在 流水 线 中 ,往往 会 发 生 在 同一 个 操作 周期 同时 需要 预 取 一 条 指令 和 
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执行 另 一 条 指令 的 取 数 据 操 作 的 情况 。 知 采用 指令 和 数据 统一 的 cache, 则 这 种 情况 会 造成 
取 指 令 和 取 数 据 的 访 存 冲突 ,冲突 的 结果 就 是 使 得 流水 线 产 生 断 流 的 情况 发 生 , 从 而 严重 影 
响 流 水 线 的 效率 。 采 用 分 立 cache 技术 ,因为 取 指 令 和 取 数 据 分 别 在 不 同 的 cache 中 同时 进 
行 , 因 而 不 会 产生 冲突 ,有 利于 流水 线 的 实现 。 


4.4.6 cache 举例 : Pentium 4 的 cache 组 织 


首先 通过 表 4-2 来 看 看 Intel CPU 使 用 cache 技术 的 演变 。80386 不 包含 片 内 cache， 
但 育 次 在 外 部 (机 融 主 板 上 ) 使 用 了 cache 技术 。80486 处 理 此 速度 的 提高 使 外 部 总 线 成 为 
处 理 融 访问 外 部 cache 的 瓶颈 ,于 是 在 486 片 内 使 用 了 一 个 小 容量 的 cache(8KB) ,来 用 每 
块 16B 的 四 路 组 相 联 映射 机 制 。Pentium 处 理 表 及 用 了 分 立 cache 技术 ,包含 两 个 片 内 L1 
cache ,分 别 用 于 数据 和 指令 。Pentium Pro 处 理 需 及 用 了 前 病 总 线 扩 术 ,处理 币 和 2 cache 
之 间 采 用 高 速 总 线 互 联 , 而 Pentium 中 处理 疾 则 将 L2 cache 移 到 了 片 内 ,其 容量 达到 了 
256KB, 每 块 128B, 采 用 8 路 组 相 联 映 射 机 制 。Pentium 出 处 理 融 添加 了 一 个 外 部 L3 
cache ,而 Pentium 4 处 理 囊 则 将 大 容量 L3 cache 移 到 了 片 内 。 


表 4-2 ”Intel CPU 使 用 cache 技术 的 演变 


Intel CPU 采用 的 cache 技术 解决 的 回 题 
80386 使 用 外 部 cache 外 部 存储 器 慢 于 系统 总 线 
z z 处 理 紫 速度 的 提高 导致 外 部 总 线 成 为 cache 
将 外 阁 che 之 小 理 希 必 上 斤 上 | 
将 外 部 cache 移 到 人 处理 器 芯片 在 取 的 瓶颈 
由 于 片上 可 用 面积 有 限 , 内 部 cache 相当 小 
当 指 令 预 取 部 件 和 执行 单元 同时 请 求 访 问 
cache 时 产生 冲突 ,使 指令 执行 的 流水 操作 产 


80486 


使 用 分 立 的 数据 cache 和 指 
令 cache 


Pentium 


采用 分 立 的 前 端 总 线 ( 外 部 的 主 

总 线 ) 和 后 端 总 线 BSB 技术 ， 

BSB 以 更 高 速度 运行 ,专用 于 

L2 cache 

Pentium | 将 L2 cache 移 到 处 理 顺 芯片 上 

hasta 添加 外 部 的 L3 cache 某 些 应 用 与 海量 数据 库 打交道 ,必须 具有 对 
将 大 容量 的 L3 cache 也 移 到 处 | 海量 数据 的 快速 存 取 能 力 , 而 片上 的 cache 
理 豆 必 片 上 容量 太 小 


Pentium Pro 


处 理 器 速度 的 提高 导致 外 部 总 线 成 为 L2 
cache 存 取 的 瓶颈 


Pentium 4 


图 4-39 给 出 了 一 个 Pentium 4 处 理 各 的 内 部 组 织 结 构 价 化 图 ,看 重 cache 的 组 织 和 布 
局 。Pentium 4 处 理 硕 的 核心 由 以 下 几 个 主要 部 件 组 成 。 
) 取 指 令 , 译 公 部 件 (Fetch/Decode Unit) : 根据 指令 地 址 从 L2 cache 中 取 指 令 ,并 将 
指令 代码 详 人 码 成 一 系列 的 微 操 作 存 人 Ll 指令 cache 中 。 
(2) 执行 单元 (Execution Unit) : 执行 Ll 指令 cache 中 的 微 操 作 ,并 由 革 ]1 数据 cache 
下 所 需 数据 , 存 人 寄存 器 中 暂 存 。 执 行 单元 可 依据 数据 相关 性 和 资源 可 用 性 调度 微 操 作 的 
执行 ,使 得 微 操 作 的 执行 可 按 不 同 于 所 取 指 令 流 的 顺序 被 调度 执行 ,只 要 时 间 许 可 ,此 单元 
成 将 来 可 能 需要 的 微 操 作 的 推测 执行 。 
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1 地 人 
执行 单元 上 L1 指 令 cache 取 指 令 / | 64 位 系统 总 线 
执行 单元 上 (12KBuop) 泽 码 单元 | 


L3 cache 


(1MB) 


蔚 效 奇 仔 硝 组 得 总 奇 仔 稍 组 


L2 cache 
(236KB) 


2561Y 


L1i 丘 cache(8KB) 


4-39 Pentium 4 处 理 咒 的 内 部 组 织 结构 图 


(3) 存储 表 子 系统 (Memory Subsystem) : 这 部 分 包括 L2 和 1L3 cache 及 系统 总 线 。 当 
L2 和 L3 cache 未 命中 时 ,使 用 系统 总 线 访 问 主 和 存 。 系 统 总线 还 用 于 访问 系统 输入 输出 

(4) 整数 运算 和 浮 点 数 运 算 部 件 ALU。 

不 同 于 所 有 以 前 的 Pentium 和 其 他 大 和 多数 处 理 需 所 采用 的 cache 组 织 ,Pentium 4 指令 
cache 位 于 指令 译 码 融和 执行 单元 之 间 。 取 指令 /指令 译 人 码 部 件 完 成 指令 的 预 取 和 详 码 工 
作 ,L1l cache 存储 实际 上 是 指令 译 人 码 后 得 到 的 微 操 作 人 码 , 这 样 就 使 得 执行 部 件 能 从 Ll cache 
中 取出 耳 接 执行 的 微 代 人 码 , 加 快 了 指令 的 执行 速度 。 

L2 和 L3 cache 采用 的 是 8 路 组 相 联 映射 机 制 ,每 块 128B。 


4.5 虚拟 存储 器 


早 在 1961 年 喘 国 曼彻斯特 大 学 的 Kilburn 等 就 提出 了 虚拟 存储 各 的 概念 ,经 过 20 世 
纪 60 年 代 初 到 70 年 代 初 的 发 展 完善 ,虚拟 人 存储 着 已 广 记 应 用 于 大 中 型 计算 机 系统 中 。 
1982 年 ,Intel 公司 首次 在 其 推出 的 微 处 理 器 80286 上 集成 了 虚拟 存储 器 管理 功能 。 到 现 
在 ,几乎 所 有 的 机 融和 都 及 用 了 虚拟 存储 套 拉 术 。 


在 前 面 的 4.1.3 刷 中 已 经 讲 到 ,现代 计算 机 的 存储 大 采用 分 层 结构 , 即 “cache- 主 存 - 辅 
人 存 ” 这 种 二 级 结构 。 实 际 上 ,这 里 包含 了 两 个 主要 层次 .一 是 “cache- 主 存 ” 层 次 ,其 目标 是 通 
过 增加 小 容量 的 高 速 cache 提高 CPU 的 访 存 速度 ,但 对 程 厅 空间 的 容量 不 产生 任何 影响 ; 
二 是 “ 主 存 - 辅 存 ” 层 次 ,其 目标 是 为 用 户 提 供 一 个 还 还 大 于 主 存 容量 的 程序 空间 。 

随 者 用 户 程 序 对 主 存 容量 的 要 求 越 来 越 高 ,计算 机 主 存 储 帮 在 容量 配置 上 不 断 提 高 ,从 
早期 的 几 十 KB 到 几 百 KB 到 现在 的 几 百 MB 到 几 十 GB。 但 主 存 容量 的 配置 总 是 受到 一 
定 因 素 的 制约 。 一 方面 ,出 于 机 融 性 能 价格 比 的 考虑 ,价格 较 贯 的 主 存储 豆 容 量 不 可 能 配置 
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得 太 大 。 其 实 , 作 为 计算 机 系统 设计 者 来 讲 , 如 果 只 追求 性 能 ,不 考虑 价格 ,机 各 的 主 存 储 痢 
完全 可 以 使 用 单一 的 存储 介质 实现 , 即 采 用 大 容量 、 高 速 的 存储 右 件 构成 计算 机 的 主 存储 
艇 。 但 这 样 做 的 后 条 是 机 融 的 价格 很 高 ,其 中 存储 表 占 到 了 机 融 成 本 的 主要 部 分 ; 为 一 方 
面 ,在 不 同 的 应 用 场合 ,应 用 程序 对 主 存 容量 的 要 求 有 所 不 同 。 作 为 通用 计算 机 来 讲 ,满足 
了 大 容量 存储 冀 要 求 的 应 用 宕 要 ,对 小 容量 存储 冀 要 求 的 应 用 就 显得 浪费 。 在 既 要 考虑 性 
能 又 要 考虑 价格 的 情况 下 ,如何 权 衡 和 配置 计算 机 的 主 存储 徊 就 显得 非常 困难 。 如 有 果 能 够 诅 
过 合理 的 设计 ,在 不 增加 机 带 太 多 成 本 和 开销 的 情况 下 ,为 用 户 程序 提供 一 个 足够 大 的 存储 空 
间 ,从 而 满足 所 有 应 用 的 需要 , 何 乐 而 不 为 呢 。 虚 拟人 存储 带 正 是 为 实现 这 一 目标 而 提出 的 。 

虚拟 存储 硕 是 一 种 由 价格 较 高 .速度 较 快 、 容 量 较 小 的 主 和 存储 闫 和 一 个 价格 低廉 、 速 度 
较 慢 .容量 巨大 的 辅助 存储 融 组 成 的 存储 层次 ,在 系统 软件 和 辅助 硬件 的 管理 下 就 像 一 个 单 
一 的 .可 直接 访问 的 大 容量 存储 第 ,以 透明 方式 为 用 户 程序 提供 一 个 远大 于 主 存 容 量 的 存储 
空间 。 

在 未 使 用 虚拟 存储 硕 的 机 融 中 ,用 户 程 序 所 需 存 储 空 间 不 能 大 于 机 郑 实 际 能 提供 的 主 
存 容 量 ,如 果 用 户 程序 过 大 ,其 所 需 存 储 空间 超出 了 主 存 能 提供 的 容量 , 则 要 么 该 程序 无 法 
运行 ,要 么 由 用 户 上 自行 完成 对 程序 的 分 块 处 理 和 存储 分 配 工 作 ,这 对 一 般 用 户 来 讲 是 非常 困 
难 的 。 而 在 使 用 了 虚拟 存储 天 的 机 带 中 ,允许 用 户 程序 空间 大 于 机 带 实 际 主 存 空间 。 当 用 
户 程序 所 需 存 储 空 间 大 于 主 存 当前 能 够 提供 的 存储 容量 时 ,由 系统 将 用 户 程序 的 一 部 分 先 
人 存放 在 辅助 存储 表 中 , 当 运 行 到 这 部 分 程 


序 时 ,再 将 它们 从 辅 存 中 调 出 ,并 分 配给 它们 合适 
的 主 存 空间 执行 。 程 序 在 存储 冀 中 的 分 配 完 全 在 系统 的 控制 下 进行 ,无 须 用 户 的 干预 。 这 
对 多 用 户 、 多 这 程 厅 系 统 来 讲 显 得 尤为 重要 ,可 以 避 倪 因为 用 户 的 日 行 存储 分 配 有 影响 到 其 他 
用 户 程序 在 存储 硕 中 的 正 稼 执行 的 情况 发 生 。 

虚拟 存储 融 的 “ 主 存 - 辅 存 ? 层 次 的 实现 原理 与 前 面 讲 述 的 "cache- 主 存 ? 层 次 的 实现 原理 
很 相似 。 这 主要 体现 在 两 个 方面 : 一 是 组 织 结构 相似 ,在 这 两 种 层次 中 , 面 同 CPU 的 存储 
售 是 由 相对 来 讲 小 容量 高 速 存 储 血 件 构成 的 ,而 后 援 存 储 冀 则 是 由 相对 来 讲 大 容量 低速 存 
储 右 件 构 成 的 ,小 容量 存储 器 中 存储 的 内 容 总 是 大 容量 存储 右 所 存储 内 容 的 一 部 分 ; 二 是 
工作 原理 相似 ,用 户 程序 事先 存放 在 大 容量 后 援 存储 侣 中 , 当 执 行程 序 时 ,CPU 首先 访问 的 
是 小 容量 存储 器 , 若 命中 , 则 完成 本 次 访问 , 若 不 命中 , 则 再 到 大 容量 存储 器 中 访问 ,并 同时 
按 一 定 的 规则 将 大 容量 存储 天 中 的 一 部 分 内 容 芍 换 小 容量 存储 天 中 的 一 部 分 内 容 。 当 然 ， 
还 有 非常 重要 的 一 点 就 是 实现 虚拟 存储 剖 同 样 基于 的 是 程序 的 局 部 性 原理 , 硅 没 有 程序 访 
问 的 局 部 性 ,CPU 访问 小 容量 存储 融 频 频 失 效 , 则 会 大 大 降低 CPU 访问 存储 系统 的 效率 。 

在 实现 虚拟 存 人 和 储备 管理 的 机 各 中 ,能 提供 给 用 户 程 序 运 行 的 是 一 个 比 主 存 大 得 多 的 虚 
拟 空间 , 称 为 虚 存 ; 而 真正 为 用 户 程序 提供 实际 运行 空间 的 是 主 存 ,又 称 为 实 存 。 程 序 中 出 
现 的 指令 或 数据 地 址 是 逻辑 地 址 ,又 称 为 虚 地 址 ; 而 主人 存 地 址 是 中 正 的 物理 地 址 ,又 称 为 实 
地 址 。 与 “cache- 主 存 ” 层 次 相似 , 当 CPU 访问 虚拟 存储 着 时 ,首先 给 出 的 是 虚 地 址 ,通过 一 
定 的 地 址 转换 机 制 ,变换 成 一 个 实地 址 ,再 按 此 实地 址 访问 主 存 。 虚 拟 存储 套 的 工作 原理 如 
4-40 所 示 。 

从 图 4-40 中 可 以 看 出 ,与 “cache- 主 存 ” 层 次 相似 ,在 实现 虚拟 存储 徊 管理 中 ,要 完成 一 
个 虚 地 址 到 实地 址 的 变换 过 程 ,这 一 变换 过 程 是 由 一 个 存储 管理 单元 (MMU) 来 实现 的 。 
万 外 , 当 访 主 存 失效 (不 命中 ) 时 ,需要 将 虚 存 中 的 一 部 分 内 容 调 人 主 存 中 , 调 人 的 容量 大 小 
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图 4-40 虚拟 存储 需 工 作 原 理 图 


也 同样 与 虚拟 存储 天 管理 机 制 有 关 。 在 这 里 主要 介绍 虚拟 存储 硕 的 三 种 管理 机 制 : 分 页 式 
虚拟 存储 前 管 理 、 分 段 式 虚 拟人 存储 表 管 理 和 段 页 式 虚 拟人 存储 天 管理 。 


4.5.2 虚拟 存储 帝 的 分 页 元 常理 


在 及 用 分 页 陈 管 理 的 机 送 中 , 主 存 和 虚 存 都 划分 成 固定 大 小 的 块 一 一 页 , 主 存 的 页 称 为 
实 页 , 虚 存 的 页 称 为 虚 页 , 实 页 和 虚 页 的 大 小 是 相同 的 。 实 地 址 和 虚 地 址 郡 由 两 部 分 组 成 ， 
分 别 为 实 页 号 / 虚 页 号 和 页 内 偏 移 地 址 ,如 图 4-41 所 示 。 
对 于 CPU 访问 的 某 一 个 字 单 元 来 说 ,实地 址 中 的 
实 页 号 和 虚 地 址 中 的 虚 页 号 是 不 同 的 ,但 两 个 地 址 中 的 
页 但 移 是 相同 的 。 
在 分 页 式 虚拟 存储 器 中 , 任 一 个 虚 页 可 以 映射 到 主 
存 的 任 一 个 实 页 上 , 虚 地 址 到 实地 址 的 变换 是 通过 存放 图 441 和 实地 址 和 虚 地 址 的 
在 主 存 中 的 页 表 来 实现 的 。 页 表 由 一 个 个 页 表 项 组 成 ， 己 成 形式 
每 个 虚 页 在 页 表 中 占 一 个 页 表 项 ,并 按 虚 页 号 的 顺序 排 
列 。 页 表 项 的 内 容 主 要 包括 该 虚 矶 所 在 主 存 的 实 矶 号 和 一 些 控 制 信息 ,如 图 4-42 所 示 ， 
下: 装 入 位 。F= 二 1 表示 该 虚 页 已 装 入 主 存 中 ; FF 二 0 表示 该 虚 页 还 没 装 入 主 存 。 
C: 修改 位 。 用 于 表示 该 页 装 人 主 存 后 是 否 被 修改 过 。 


人 蕙 页 与 页 内 信物 庶 地 址 
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到 4-42 ”分 页 式 虚 拟人 存储 融 地 址 变换 


实地 址 


虚 地 址 
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RW: 访问 方式 字段 。 用 于 表示 该 页 可 以 允许 以 “ 读 - 写 -执行 ”方式 中 的 哪些 方式 访问 。 

页 表 在 主 存 中 的 位 置 通过 一 个 页 表 基 址 寄存 冀 来 指明 ,页 表 项 的 内 容 是 在 每 个 虚 由 并 
人 主 存 时 填写 的 。 

当 用 户 程 序 中 给 出 一 个 访 存 虚 地 址 时 ,系统 首先 以 页 表 基 址 寄存 器 中 的 内 容 为 基地 址 ， 
虚 地 址 中 的 虚 页 号 为 偏 移 量 ,找到 该 虚 地 址 所 对 应 的 存放 在 主 存 中 的 页 表 的 页 表 项 。 然 后 
me 下 的 状态 判断 该 虚 页 是 否 已 经 狼 入 主 存 。 背 已 装 和 信 , 则 从 该 页 表 项 中 取出 实 页 

再 结合 页 内 偏 移 地 址 一 起 共同 形成 一 个 访 主 存 的 物理 地 址 。 知 未 装 人 , 则 产生 页 面 失效 
ww 

由 于 页 面 的 划分 只 是 机 械 地 对 虚 . 实 存 空间 进行 等 分 ,因此 ,页 面 失效 有 可 能 发 生 在 一 
条 指令 的 执行 过 程 之 中 。 例 如 ,对 于 按 字 节 编 址 的 存储 右 , 就 可 能 出 现 一 条 指令 跨 页 存储 的 
情况 。 当前 一 页 已 在 主 存 ,而 后 一 页 不 在 主 存 时 , 则 在 取 指 令 过 程 中 就 会 发 生 页 面 失效 。 同 
理 ,在 取 操 作 数 ( 特 别 是 字符 串 ) .间接 寻 址 及 写 回 结果 的 过 程 中 都 可 能 发 生 页 面 失效 。 对 于 
这 种 故障 ,处 理 机 必须 立即 啊 应 和 处 理 , 和 否则 该 条 指令 无 法 执行 下 去 。 如 何 保存 和 恢复 故障 
点 的 现场 ,使 得 故障 处 理 完成 后 ,又 能 正确 地 从 断 点 处 继续 执行 指令 ,这 是 保证 虚拟 存储 需 
能 否 正 确 工 作 的 关键 性 问题 之 一 。 目 前 ,有 的 机 髓 采用 后 援 寄 存 器 技术 , 即 把 该 条 指令 的 故 
障 现场 全 部 保存 下 来 , 当 处 理 完 该 故障 ,把 所 需要 的 页 调 人 主 存 后 ,再 从 故障 点 处 继续 执行 

完 该 条 指令 。 有 的 机 器 则 是 保存 部 分 有 关 现 场 , 使 该 指令 能 从 头 再 开始 执行 。 有 的 机 顺 则 

采用 预 判 技 术 。 例如 ,在 执行 字符 串 指令 前 , 预 判 断 字 符 串 的 首 、 尾 字符 所 在 页 是 否 已 在 主 
存 中 ,如 果 在 , 则 执行 这 条 指令 ,只 要 有 一 个 还 没 装 和 人 主 存 ,就 产生 页 面 失效 故障 请 求 , 在 把 
该 页 调 人 后 , 才 开 始 执行 这 条 字符 串 指 令 。 

在 页面 失效 时 ,要 求 把 该 页 由 辅 存 调 入 主 存 ,因此 必须 给 出 该 页 在 辅 存 的 物理 地 址 。 辅 
存 一 般 按 信息 块 (对 磁盘 而 言 为 忆 区 ) 编 址 , 且 一 个 块 的 大 小 通常 等 于 一 个 页 面 的 大 小 。 对 
磁盘 存储 紫 来 说 ,其 物理 地 址 格式 如 图 4-43 所 示 。 


图 4-43 


将 虚 地 址 变换 成 磁盘 的 物理 地 址 时 , 即 把 虚 页 号 变换 成 某 个 磁盘 机 上 的 某 个 肩 区 号 。 
为 此 , 宕 有 一 个 虚 贝 号 与 辅 存 物理 地 址 的 映像 表 , 该 表 称 为 外 页 表 ( 相 对 应 的 前 述 忠 表 称 为 
内 页 表 )。 图 4-44 示 出 了 外 页 表 的 结构 。 它 也 按 虚 页 号 的 顺 友 排列 ， 人 | 
占有 一 项 ,记录 该 页 在 辅 存 中 的 物理 地 址 。 外 页 表 的 内 容 是 在 把 程序 装 人 辅 ? 
中 M 为 装 人 位 。 


图 4-44 外 页 表 结 构 
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通常 外 页 表 是 存在 辅 存 中 的 。 当 菏 个 程序 初 娘 运行 时 ,就 把 外 页 表 的 内 容 抄 录 到 已 建 
立 的 内 页 表 的 实 页 号 字 段 中 。 在 进行 虚 地 址 到 和 实地 址 变换 时 , 夺 出 现 页 面 失 效 , 从 内 页 表 的 
实 页 号 字段 中 取出 的 正 是 辅 存 物理 地 址 。 而 当 该 页 调 人 主 存 后 ,其 实 页 号 字段 被 真正 填 人 
所 在 主 存 的 实际 页 号 。 

由 于 虚拟 存储 各 的 页面 失效 概率 较 低 ,一 般 不 到 1%。 因 此 ,由 虚 地 址 变换 成 辅 存 物 理 
地 址 完全 可 由 软件 实现 ,而 不 必 提 供 专 用 的 硬件 支持 。 页 面 失 效 时 ,由 于 访问 辅 存 需 经 机 械 
动作 ,速度 较 低 ,因而 不 是 让 人 处理 机 空 等 厦 该 由 由 辅 存 调 入 主 存 ,; 而 是 切换 a 到 其 他 已 准备 就 
绪 的 任务 (进程 ) ,把 调 页 工作 交 由 1/O 处 理 机 即 通 道 来 完成 。 虽然, 任务 (进程 ) 切 换 一 般 
需要 执行 几 百 甚至 几 干 条 指令 ,但 比 起 调 页 来 说 ,耗费 的 时 间 毕 苋 要 小 得 多 ，。 

虽然 页 表 是 实现 分 页 式 虚 拟 存 储 冀 的 关键 ,但 同时 注意 到 ,在 页 式 虚 拟 存 储 兹 中 ,每 次 
访 存 部 要 增加 一 个 查 页 表 的 过 程 ,而 页 表 是 存放 在 主 存 中 的 ,这 就 相当 于 每 次 多 增加 了 一 次 
访 主 存 的 操作 。 如 果 这 个 查 页 表 的 操作 时 间 不 能 多 短 ,虚拟 存储 冀 是 没有 实用 价值 的 。 
此 ,如 何 加 快 地 址 变换 速度 ,就 成 为 提高 虚拟 存储 冀 速 度 的 为 一 个 关键 问题 ,一 种 较 好 的 解 
决 办 法 是 采用 所 谓 “ 快 表 ” 的 方法 。 

仔细 分 析 实 际 查 表 的 过 程 可 以 发 现 , 巾 于 程序 局 部 性 的 特点 ,对 页 表 内 各 页 表 项 的 使 用 
不 是 随机 的 ,而 是 族 聚 的 , 即 在 某 一 段 时 间 内 ,实际 上 只 用 到 页 表 中 很 少 的 几 个 页 表 项 。 
此 ,可 以 单独 来 用 快速 硬件 ,实现 只 合 有 部 分 页 表 项 的 地 址 映像 变换 表 , 这 种 用 快速 硬件 实 
现 的 部 分 页 表 称 为 转换 著 视 缓冲 髓 (Translatim Lookaside Buffer,TLB) ,又 称快 表 , 而 相对 
地 把 原来 的 页 表 称 为 慢 表 。 快 表 比 慢 表 小 得 多 ,其 内 容 只 是 慢 表 的 一 个 小 的 副本 。 

快 表 可 用 相 联 存储 套 实 现 ,其 中 的 各 页 表 项 含有 最 近 访 问 的 虚 页 号 及 其 对 应 的 主 存 实 
页 号 。 图 4-45 给 出 了 使 用 快 表 , 慢 表 结 合 进行 地 址 变换 的 过 程 。 


% 


庶 地 址 


| 实地 址 


快 表 TLB 
( 按 内 容 访问 ) 
到 4-45 ”快慢 表 结合 实现 虚 地 址 7 


首先 按 虚 地 址 中 的 虚 页 号 同时 到 快 表 和 慢 表 中 进行 查找 。 在 快 表 中 采用 的 是 相 联 比较 
( 按 内 容 访问 ) , 右 该 虚 页 号 已 在 快 表 中 , 则 可 以 直接 从 对 应 的 项 中 取出 实 页 所 ,与 虚 地 址 中 
的 页 内 偶 移 地 址 一 道 共同 形成 访 主 存 的 实地 址 ,并 同时 使 查 慢 表 的 操作 作废 。 看 该 虚 页 与 
不 在 快 表 中 , 则 在 慢 表 中 继续 查找 ,一 方面 通过 慢 表 继 组 完 成 虚 地 址 的 转换 工作 , 夯 一 方面 
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将 找到 的 虚 页 号 和 对 应 的 实 页 号 同时 存 入 快 表 中 ， 
由 上 可 见 , 快 表 和 慢 表 又 构成 了 一 个 表层 次 。 如 果 快 表 的 命中 率 相 当 高 , 则 使 地 址 变换 
所 需 时 间接 近 于 快 表 ， 


副 拟 存储 剖 的 分 段 式 官 


上 述 虚 拟 存储 船 的 分 页 式 管理 控制 简单 ,实现 起 来 较为 容易 。 然 而 它 却 存在 两 个 方面 
的 问题 。 

一 方面 当 虚 存 空间 很 大 时 ,外表 也 将 非常 庞大 。 例 如 ,假设 实 存 空间 为 256MB, 虚 存 空 
间 为 4GB, 页 长 为 512B, 则 虚 存 共有 8M 个 页 ,也 就 意味 痢 页 表 共 8M 个 页 表 项 。 而 每 
页 表 项 中 需 存储 28 位 的 实 存 地 址 和 控制 信息 等 , 共 需 要 至 少 4 个 字 节 。 如 果 这 样 ,页 表 需 
占用 主 存 空间 为 8MX4B=32MB。 如 果 虚 存 空间 进一步 增 大 ,页 ee 
占用 主 存 空 间 的 容量 也 将 更 多 。 

万 一 方面 虚拟 存储 兽 按 页 分 配 机 制 并 不 符合 程序 存储 空间 分 配 的 特性 。 一 般 程 序 都 采 
用 模块 化 结构 设计 ,这 些 模 块 可 能 是 过 程 . 子 程序 或 图 数 调用 等 。 从 程序 的 目 然 特性 讲 ,一 
个 模块 能 够 一 次 完整 地 调 人 主 存 , 便 于 模块 的 运行 管理 和 存储 保护 。 然 而 分 页 式 虚 拟 存 储 
般 却 不 能 保证 这 一 点 。 一 个 模块 可 能 分 布 在 不 同 的 页 中 ,这 些 页 调 人 主 存 的 时 间 可 能 是 不 
同 的 ,而 且 在 主 存 空间 分 配 上 有 可 能 是 不 连续 的 ,这 就 使 得 今后 系统 对 这 一 模块 的 存储 管理 
和 保护 较为 困难 。 

虚拟 存储 融 的 分 段 陈 管理 就 是 按照 程序 的 目 然 结 构 进 行 主 存 空间 分 配 的 ,每 次 总 是 将 
一 个 程序 模块 完整 地 调 入 主 存 中 。 在 这 里 ,一 个 程序 模块 又 称 为 一 个 段 ,为 其 分 配 的 主 存 空 
间 称 为 一 个 块 。 由 于 不 同 的 程序 模块 长 度 是 不 同 的 ,因此 块 长 也 是 可 变 的 。 

为 实现 对 长 度 不 同 的 段 进 行 空 间 分 配 , 操 作 系 统 必 须 对 主 存 空间 进行 有 效 的 管理 ,全 
如 ,通过 建立 一 些 表格 来 了 解 主 存 空间 的 占用 和 可 用 情况 。 

(1) 主 存 占用 空间 表 : 它 的 每 一 项 都 指出 所 分 配给 的 一 个 段 名 、 块 所 占用 区 域 的 基地 
址 和 殴 的 长 度 , 如 表 4-3 所 示 ，。 

(2) 主 存 可 用 空间 表 : 它 的 每 一 项 指出 一 个 未 被 占用 区 的 地 址 和 长 度 , 如 表 4-4 所 示 。 

表 4-3 主 存 占用 空间 表 表 4-4 主 存 可 用 空间 表 
块 长 可 用 块 基 址 可 用 块 长 


个 


段 名 


当 一 个 程序 段 需 要 从 辅 存 调 人 主 存 时 ,系统 首先 在 主 存 可 用 空间 表 中 查找 是 否 有 能 满 
足 该 段 空 间 分 配 的 主 存 块 。 者 有 , 则 为 其 分 配 , 并 在 主 存 占用 空间 表 中 增加 一 项 , 填 上 所 调 
人 段 的 名 字 .该 主 存 块 的 基 址 和 块 长 ,而 将 主 存 可 用 空间 表 中 已 分 配 的 该 块 删除 。 当 一 个 程 
序 段 不 再 需要 留 在 主 存 时 , 则 要 将 该 段 占 用 的 主 存 块 释放 ,同时 在 主 存 可 用 空间 表 中 增加 一 
项 可 用 块 ，。 

对 于 长 度 不 一 致 的 块 ,有 两 种 广泛 使 用 的 分 配 算法 , 即 首 次 匹配 和 最 佳 匹配 法 。 首 次 匹 
配 算 法 是 指 对 主 存 可 用 空间 表 从 头 开始 一 次 查找 ,直到 找到 一 个 能 满足 一 个 程序 段 空 间 要 
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求 的 主 存 块 。 最 佳 匹配 算法 是 指 每 次 都 要 查询 整个 可 用 空间 表 , 选 掺 一 个 能 满足 程序 段 空 
间 要 求 的 最 小 主 存 块 进行 分 配 。 现 举例 说 明 这 两 种 算法 的 区 别 。 

县 设 某 个 时 候 主 存 的 空间 初始 状态 如 图 4-46(a) 所 示 。 其 中 已 有 三 个 程序 段 Kl1、K2 和 
K3 ,阴影 部 分 为 可 用 的 空 日 区 ,每 个 存储 区 的 左边 表示 该 块 的 大 小 。 


(a) 初始 状 仿 (b) 首次 匹配 (c) 了 最 佳 匹配 
图 4-46 ” 段 式 存储 分 配 


假定 现在 要 使 长 度 分 别 为 150 与 250 的 块 K4 和 K5 分 配 到 主 存 。 图 4-46(b) 和 图 4-46 
(c) 分 别 给 出 了 采用 首次 匹配 与 最 佳 匹 配 算法 所 得 的 结果 。 这 两 种 算法 都 已 经 实现 并 取得 
了 令 人 满意 的 结果 。 上 比较 起 来 ,首次 匹配 算法 所 需 执 行 时 间 比 最 佳 匹配 算法 要 小 。 这 是 因 
为 ,首次 匹配 算法 无 须 像 最 佳 匹 配 算法 那样 每 次 都 要 查找 整个 区 域 。 夯 外 ,由 于 首次 匹配 法 
具有 把 所 有 块 集 中 分 配 到 存储 善 某 一 端的 趋向 ,那么 可 用 空间 的 大 区 域 可 能 在 存储 融 的 另 
一 端 出 现 , 可 用 来 容纳 今后 大 的 块 的 调 人 ,也 使 得 存储 空间 不 太 容 易 像 最 佳 匹配 法 那样 出 现 
泵 片 的 现象 。 例 如 ,在 K4 和 K5 分 配 完 的 基础 上 , 现 需 再 分 配 一 个 大 小 为 200 的 块 , 采 用 首次 
匹配 法 的 图 4-46(b) 就 可 以 实现 ,而 采用 最 佳 匹配 法 的 图 4-46(c) 则 无 法 实现 ,因为 再 也 找 不 到 
一 个 200 以 上 的 单独 的 块 了 。 因 此 ,一般 来 讲 , 首 次 匹配 法 更 适合 于 段 式 存储 空间 的 分 配 。 

在 分 段 式 虚拟 存储 天 中, 虚 地 址 也 分 为 两 个 部 分 : 段 号 和 段 内 地 址 。 为 实现 虚 地 址 到 
实地 址 的 变换 ,系统 为 此 专门 建立 了 一 个 段 表 。 段 表 由 一 个 个 段 表 项 组 成 ,每 一 个 段 表 项 对 
应 调 入 主 存 的 一 个 段 , 段 表 项 的 主要 内 容 包 括 段 在 主 存 的 起 始 地 址 、 段 长 ,法 入 位 下 和 访问 
控制 位 RW。 段 表 存 放 在 主 存 中 ,其 在 主 存 中 的 起 始 地 址 由 一 个 段 基 址 寄存 郑 指 出 。 段 表 
的 长 度 是 不 固定 的 ,并 随 着 用 户 程 序 段 的 调 进 调 出 而 变化 。 当 一 个 程序 段 被 调和 人 主 存 ,就 会 
在 段 表 中 登记 一 项 ,记录 该 段 在 主 存 中 所 分 配 的 存储 空间 的 起 始 地 址 等 信息 。 当 进行 地 址 变 
换 时 ,首先 根据 虚 地 址 中 的 段 号 在 段 表 中 找到 该 段 对 应 的 段 表 项 。 夺 FF 二 1, 则 访问 有 效 , 于 是 
从 段 表 项 中 取出 段 首 地 址 ,与 虚 地 址 中 的 段 内 地 址 共同 形成 一 个 访 存 的 实地 址 。 若 下 王 0, 则 
访问 失效 , 需 从 辅 存 中 将 该 段 调 人 主 存 。 分 段 式 虚拟 存储 天 的 地 址 变换 ,如 图 4-47 所 示 。 

段 式 虚拟 存储 器 的 优点 是 : 按 段 分 配 存 储 空间 ,一 方面 符合 程序 模块 化 的 特点 , 另 一 方 
面 便于 程序 段 在 主 存 中 的 管理 和 保护 。 后 者 是 通过 段 表 项 中 的 段 长 来 实现 的 。 当 进行 地 址 
变换 时 , 需 将 虚 地 址 中 的 段 内 地 址 与 段 表 项 中 的 段 长 进行 比较 , 奢 段 内 地 址 大 于 段 长 ,; 则 说 
明 该 虚 地 址 的 访问 超出 了 该 段 的 界限 ,于 是 系统 会 产生 一 个 越界 错误 ,禁止 本 次 访问 。 段 式 
虚拟 存储 融 的 缺点 是 : 当 系 统 进行 了 频繁 的 块 调 进 和 调 出 后 ,会 使 主 存 出 现 雄 块 现象 ,导致 
后 续 的 段 无 法 分 配 的 情况 出 现 ， 
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图 4-47 分 段 式 虚拟 存储 器 地 址 变换 


4.5.4 虚拟 存储 希 的 段 页 式 管 


上 述 的 分 页 式 管 理 与 分 段 式 管理 结合 起 来 就 形成 了 段 页 式 虚 拟 存 储 髓 系统 , 它 可 以 羔 
得 两 者 的 优点 , 即 一 方面 具有 分 页 式 简 单 .不 会 产生 碎片 等 的 优点 , 另 一 方面 又 具有 按 程 序 
目 然 段 进行 空间 分 配 所 再 来 的 存储 管理 和 存储 保护 等 方面 的 优点 。 在 段 页 式 系统 中 , 程 订 
育 先 按 模块 分 段 , 然 后 再 对 每 个 段 划 分 固定 大 小 的 页。 这 就 使 得 程序 段 在 主 存 的 调 进 调 出 
可 以 按 页 进行 空间 分 配 , 同 时 又 可 以 按 段 进行 管理 和 保护 。 

为 实现 段 页 式 管 理 , 系 统 为 每 个 调 人 主 存 运 行 的 程序 单独 建立 一 个 段 表 和 一 组 页 
段 表 的 每 一 项 对 应 一 个 段 , 其 内 容 包 括 该 段 对 应 的 页 表 的 起 始 地 址 及 相关 控制 信息 。 段 表 
在 主 存 中 的 起 始 地 址 由 一 个 段 表 基地 址 寄存 器 指出 。 页 表 用 于 指明 该 段 各 页 在 主 存 的 分 配 
情况 ,其 内 容 包 括 在 主 存 的 页 号 、 装 入 位 下 和 修改 位 C 等 。 在 段 页 式 虚 拟 存储 器 中 ,用 户 程 
序 的 地 址 由 三 部 分 组 成 : 段 号 、 页 号 和 页 内 偏 移 。 地 址 变换 过 程 如 图 4-48 所 示 。 

首先 根据 段 表 基地 址 寄存 器 的 内 容 和 虚 地 址 中 的 段 号 找到 该 程序 段 的 段 表 项 ,然后 根 
据 段 表 项 中 的 页 表 首 址 和 虚 地 址 中 的 页 号 找到 对 应 的 页 表 项 ,最 后 从 页 表 项 中 取出 实 页 号 ， 
与 虚 地 址 中 的 页 内 偏 移 一 起 形成 访 主 存 的 实地 址 。 

可 以 看 出 , 段 页 式 虚 拟 存储 器 系统 在 进行 虚 地 址 到 实地 址 变换 时 至 少 需要 经 历 两 次 查 
表 过 程 , 即 先 查 段 表 ,再 查 页 表 。 因 此 ,占用 的 时 间 也 就 更 多 。 而 且 , 当 一 个 页 表 的 大 小 超过 

一 个 页 面 的 大 小 时 ,页 表 就 被 分 成 了 几 个 页 ,这 时 又 需 设置 二 级 页 表 , 构 成 二 级 页 表层 次 。 
一 个 大 的 程序 可 能 需要 设置 多 级 页 表层 次 。 对 于 多 级 页 表层 次 ,在 程序 运行 时 ,除了 第 一 级 
页 表 需 驻 留 在 主 存 之 外 ,其 他 页 表 可 存放 在 辅 存 中 ,需要 时 再 由 第 一 级 页 和 调和 人 ,从 而 减少 
每 道 程 序 页 表 所 占 主 存 的 空间 。 

为 加 快 查 表 的 速度 ,在 段 页 式 虚 拟人 存储 天 中 同样 需要 采用 快慢 表 结 合 的 方式 进行 虚 地 
址 的 变换 。 

在 多 用 户 多 道 程序 系统 中 ,允许 有 和 多 个 用 户 的 程序 同时 运行 ,这 时 需要 使 用 一 个 基 号 
(又 称 用 户 标识 号 ) 来 标识 和 区 分 所 运行 的 每 息 程 序 。 系 统 会 为 每 道 用 户 程序 设置 一 个 段 表 
基 址 寄存 器 ,用 于 指明 系统 为 用 户 程序 建立 的 段 表 在 内 存 中 的 起 始 地 址 。 而 虚 地 址 中 需 增 
加 一 个 基 号 字段 ,如 图 4-49 所 示 。 
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段 表 基 址 寄存 琐 上 段 与 页 与 


段 0 页 航 


BE 


图 4-49 ”在 虚 地 址 中 增加 一 个 基 号 字段 


【 例 4.4】 假设 某 时 间 机 器 中 运行 有 三 道 程序 (用 户 标 识 号 分 别 为 A、B、C) ,它们 对 应 
的 段 表 基 址 寄存 器 内 容 分 别 为 Sa。、Ss 和 Sc。 现 假设 程序 中 给 出 了 一 个 虚 地 址 C-1-2-0100 
( 即 程序 C 的 第 1 段 第 2 页 中 的 偏 移 地 址 为 0100 的 单元 ) , 试 通过 图 示 的 方式 说 明 其 虚 地 址 
到 实地 址 的 变换 过 程 。 

解 : 本 例 中 , 设 ABC 三 道 程序 分 别 有 3、2、3 个 段 , 其 中 程序 C 的 三 个 段 分 别 为 Cu、 
Ci、Cz ,各 上 自 对 应 内 存 中 的 一 个 页 表 ,三 个 段 长 度 分 别 为 2.3、2 页 。 将 虚 地 址 C-1-2-0100 恋 
换 为 实地 址 的 过 程 如 图 4-50 所 示 。 

首先 根据 虚 地 址 中 的 基 号 找到 对 应 程序 C 的 基 址 寄存 器 , 按 基 址 寄存 器 中 的 地 址 找到 
该 程序 在 内 存 中 的 段 表 ; 紧 接着 由 虚 地 址 中 的 段 号 找到 有 段 表 中 的 相应 段 1 项 , 按 段 1 项 中 
的 页 表 首 址 找到 段 1 对 应 的 页 表 ; 再 由 虚 地 址 中 的 页 号 找到 页 表 中 的 页 表 项 2, 从 此 项 中 取 
出 该 虚 页 在 内 存 中 的 实 页 号 10; 最 后 由 实 页 号 10 和 页 内 地 址 0100 一 起 共同 形成 访 主 存 的 
实地 址 。 


4.5.5 虚拟 存储 器 的 替换 策 树 


在 虚拟 存储 器 中 ,由 于 虚 存 空间 比 实 存 空间 大 得 多 ,必然 会 出 现 主 存 中 所 有 页 已 经 全 部 
被 占用 的 情况。 这 时 如 果 又 有 新 的 页 需要 从 辅 存 调 人 主 存 时 就 会 发 生 页 面 失效 。 当 发 生 页 
面 失效 时 ,就 必须 将 主 存 中 的 某 个 页 替换 出 去 ,以 接纳 来 自 辅 存 要 调 人 的 页 。 那 么 ,按照 什 
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其 号 段 与 页 与 页 和 内 侦 攀 


实 幢 与” 页 内 懈 移 


实地 址 


“本 Co 段 页 表 
sc [~ Cot0 
程序 B 段 表 Cori 


Cl 段 页 表 


Sc+2 Cs 段 页 表 


Ctl| 16 


图 4-50 有 段 页 式 虚 地 址 转换 


么 规则 苦 换 主 存 中 的 页 呢 ? 这 就 是 虚拟 存储 右 蔡 换算 法 要 解决 的 问题 。 

选择 蔡 换 算法 ,一 方面 要 看 这 种 算法 是 否 反 映 了 程序 的 局 部 性 ,使 主 存 的 命中 率 得 以 提 
高 ; 另 一 方面 要 看 这 种 蔡 换 算法 是 否 易于 实现 。 虚 拟 存 储 器 中 的 页 面 替 换 策 略 和 cache 中 
的 块 蔡 换 策略 有 很 多 相似 之 处 ,但 有 三 点 显著 不 同 : 

(1) 当 虚 拟 和 存储 严 发 生 页 面 失效 时 至 少 要 涉及 一 次 对 辅 存 的 存 取 操作 ,而 对 辅 存 的 存 
取 操 作 速 度 远 比 对 主 存 的 谈 取 操作 慢 , 从 而 使 系统 所 遭受 的 时 间 上 的 损失 要 远 比 cache 未 
命中 时 大 得 多 。 

(2) 虚拟 存储 融 的 页 面 蔡 换 是 由 操作 系统 软件 来 完成 的 。 

(3) 由 于 主 存 空间 远 比 cache 空间 大 , 主 存 与 虚 存 空间 之 间 又 是 全 映射 方式 ,因此 虚拟 
存储 如 页面 蔡 换 的 选择 余地 很 大 ,属于 一 个 进程 的 页 面 和 都 可 符 换 。 

虚拟 存储 髓 中 的 蔡 换 策略 一 般 采 用 LRU 算法 .LEFU 算法 FIFO 算法 ,或 将 两 种 算法 结 
合 起 来 使 用 。 

对 于 将 被 蔡 换 出 去 的 页 面 ,假如 该 页 调 入 主 存 后 没有 被 修改 过 ,就 不 必 进 行 处 理 , 否 则 
就 必须 把 该 页 重新 写 人 辅 存 , 以 保证 辅 存 中 数据 的 正确 性 。 

【 例 4.5】 假设 主 存 只 有 三 个 页 面 , 某 程 序 访问 虚 页 面 的 序列 是 2、3、2、1、5、2、4、5、3、 
2.5、2 页 。 试 求 分 别 采用 FIFO 和 LRU 替换 算法 时 的 命中 率 。 

解 : 分 别 来 用 FIFO 和 LRU 替换 算法 时 的 主 存 页 面 变 化 情况 如 图 4-51 所 示 。 

其 中 FIFO 算法 在 12 次 访问 中 命中 3 次 ,命中 率 为 25%; 而 LRU 算法 命中 5 次 ,命中 
率 为 12。 
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4.5.6 虚拟 存储 器 举例 : Pentium 的 虚拟 存储 器 组 织 
1. Pentium CPU 的 虚 地 址 模式 


图 4-51 主 存 页 面 变 化 情况 


Pentium CPU 的 虚拟 存储 项 管理 是 通过 存储 管理 部 件 MMU 来 完成 的 ,MMU 包括 分 
段 部 件 (SU) 和 分 页 部 件 (PU) 两 部 分 , 它 人 允许 SU 和 PU 单独 工作 或 同时 工作 ,从 而 文 持 以 
下 三 种 受 保 护 的 虚拟 地 址 模式 (简称 保护 模式 ): 

1) 分 段 不 分 页 模式 

虚拟 地 址 (在 Pentium CPU 中 称 为 逻辑 地 址 ) 由 一 个 16 位 的 段 选 择 符 和 一 个 32 位 的 
偶 移 地 址 组 成 。 段 选择 符 的 高 14 位 用 于 指定 具体 的 段 ,最 低 2 位 用 于 段 保护 。 一 个 进程 可 
拥有 的 最 大 虚拟 地 址 空间 为 24+2 一 266 一 64TB。 分 段 部 件 (SU) 将 二 维 的 分 段 虚 拟 地 址 转 
换 成 一 维 的 32 位 线性 地 址 。 

这 种 模式 的 优点 是 无 须 访 问 页 目录 和 页 表 , 地 址 转换 速度 快 。 另 外 ,对 段 提供 的 一 些 保 
护 定 义 可 以 一 直 贯 通 到 段 的 单个 字 节 级 。 

2) 不 分 段 分 页 模式 

在 这 种 模式 下 SU 不 工作 ,只 是 分 页 部 件 (PU) 工 作 。 程 序 也 不 提供 段 索 引 , 程 序 中 使 
用 的 寄存 器 提供 的 32 位 地 址 被 看 成 由 页 目录 、 页 表 、 页 内 偏 移 三 个 字段 组 成 。 由 PU 完成 
虚拟 地 址 到 物理 地 址 的 转换 。 进 程 可 拥有 的 最 大 虚拟 地 址 空间 为 2 一 4GB。 

这 种 分 页 模式 虽然 减少 了 虚拟 空间 容量 ,但 一 方面 也 能 提供 保护 机 制 , 男 一 方面 比分 段 
模式 具有 更 大 的 灵活 性 。 

3) 分 段 分 页 模式 

这 是 一 种 在 分 段 基础 上 增加 分 页 存储 管理 的 模式 。 即 将 SU 部 件 转换 后 的 32 位 线性 
地 址 看 成 由 页 目录 ,页 表 、 页 内 偏 移 三 个 字段 组 成 ,再 由 PU 部 件 完成 两 级 页 表 的 查找 ,将 其 
转换 成 32 位 物理 地 址 。 一 个 进程 可 拥有 的 最 大 虚拟 地 址 空间 也 为 64TB。 这 种 模式 菲 顾 了 
分 段 模式 的 存储 保护 和 分 页 模式 灵活 的 优点 。 

2. 保护 模式 下 的 分 段 管理 

在 分 段 模式 下 ,每 一 个 程序 都 被 分 成 者 干 个 段 , 且 一 个 程序 至 少 包含 一 个 代码 段 和 一 个 
数据 段 。 每 一 个 程序 段 都 有 自己 的 基地 址 、 段 界限 以 及 保护 信息 ,这 些 信息 被 保存 在 由 操作 
系统 管理 的 全 局 描述 符 表 (Global Descriptor Table, GDT ) 或 局 部 描述 符 表 (Local 
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Descriptor Table,LDT) 内 ,这 两 个 表 的 每 一 项 称 为 段 描 述 符 
段 摘 述 符 中 存储 了 程序 段 的 基地 址 、 段 界限 以 及 保护 信息 等 。 

分 段 模 式 下 的 虚拟 地 址 (或 逻辑 地 址 ) 包 含 一 个 16 位 的 段 选择 人行 和 一 个 32 位 的 偶 移 地 
址 ,其 中 段 选择 符 的 格式 如 图 4-52 所 示 。 


由 8 个 字 节 组 成 ,也 就 是 说 ， 


图 4-52 ”有 段 选择 符 的 格式 


段 选 择 符 中 包含 了 下 列 域 。 

(1) 有 段 表 指示 和 从 (TI) : 表示 对 应 的 程序 段 是 在 GDT 中 还 是 在 LDT 中 。 
(2) 段 号 : 对 应 GDT 或 LDT 中 的 一 项 。 

(3) 请 求 特 权 级 (了 RPL) : 表示 这 个 请 求 的 特权 级 。 


分 段 模 式 下 由 逻辑 地 址 转换 成 32 位 物理 地 址 的 示意 图 ,如 图 4-53 所 示 。 


16 位 段 选择 符 32 位 偏 移 地 址 
48 位 逻辑 地 址 


段 拍 述 侍 


32 位 段 基 地 址 32 人 物理 地 址 


图 4-53 分 段 模式 下 地 址 转换 
3. 傈 护 模 陈 下 的 分 页 常理 


Pentium CPU 有 两 种 分 页 管理 方式 : 一 种 是 将 页 划分 成 4KB 大 小 ,使 用 二 级 页 表 ( 页 


目录 表 和 页 表 ) 进 行 地 址 转换 ; 男 一 种 是 将 页 划分 成 4MB 大 小 ,使 用 单 级 页 表 进 行 地 址 转 
换 。 这 里 仅 介绍 后 一 种 方式 。 


单 级 页 表 由 一 个 个 页 表 项 组 成 ,页 表 项 的 格式 如 图 4-54 所 示 。 


了 ] 2 之] 


页 基 址 


图 4-54 页 表 项 的 格式 


其 中 ,页 基 址 10 位 ,其 他 各 位 的 含义 如 下 。 
(1) I 位 : 指示 页 面 大 小 ,TI 一 1, 表 示 页 面 大 小 为 4MB; I 二 0, 表 示 幢 面 大 小 为 4KPB，。 


(2) PP 位 : 存在 位 ,P 二 11, 表示 该 页 已 装 人 人 主 存 ,P 二 0 时 访问 该 页 将 产生 缺 页 错误 。 
(3) 品位 : 修改 位 ,DD 二 1, 表 示 该 页 被 修改 过 ， 
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(5) PCD 位 : 用 于 页 cache 的 禁止 控制 。 
(6) PWT 位 : 用 于 全 写法 的 控制 。 

(7) US 位 : 用 于 用 户 /监督 控制 。 

(8) RW 位 : 用 于 读 / 写 控制 。 

分 页 方式 的 地 址 转换 过 程 如 图 4-55 所 示 。 


32 位 线性 地 址 


页 表 项 (+) 
10 位 页 基 址 ”32 位 物理 地 址 


图 4-55 ”分 页 模式 下 地 址 转换 


本 章 小 结 


章 主要 讲述 了 以 下 内 容 : 

(1) 存储 融 的 组 织 。 存 储 毅 在 物理 上 是 由 一 定 的 具有 存储 功能 的 套件 构成 的 ,在 逻辑 
上 可 以 看 成 由 一 个 个 存储 单元 构成 的 线性 地 址 空间 。 

(2) 存储 般 的 分 类 。 从 功能 上 存储 央 分 为 主 存 和 辅 存 , 主 存 主要 由 半导体 存储 髓 件 构 
成 ,而 辅 存 则 由 磁 介 质 存 储 融 或 光 存 储 融 构成 。 

(3) 计算 机 主 存储 天 的 种 类 .单元 电路 的 构成 及 工作 原理 和 主 存储 融 的 组 成 及 设计 迟 
讲述 了 提高 访 存 效率 的 交叉 存储 技术 等 。 

(4) 现代 存储 器 系统 的 存储 层次 ,包括 cache- 主 存 层次 和 主 存 - 辅 存 层次 ,讲述 了 它们 所 
基于 的 程序 局 部 性 原理 ,各 层次 的 工作 原理 和 实现 方法 等 。 


习题 四 


一 、 名 词 解释 
1. RAM 2. ROM 3， 存 储 周期 4， 存储 层 次 
5， 程序 的 局 部 性 原理 6. cache 7. 虚拟 存储 冀 8S. LFRU 


条 统 中 的 记忆 设备 , 它 主要 用 来 ( js 
人 B. 存放 程序 
C. 存放 数据 和 程序 D. 存放 微 程序 
2. 存储 单元 是 指 ( ) 。 
A. 存放 一 个 二 进 制 信息 位 的 存储 元 B. 存放 一 个 机 责 字 的 所 有 存储 元 集合 
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C. 存放 一 个 衬 广 的 所 有 存储 元 集合 D. 存放 两 个 字 刷 的 所 有 存储 元 集合 
3. 和 外 存 相 比 ,内 存 的 特点 是 (  )。 
A. 容量 大 ,速度 快 、 成 本 低 B， 容量 大 、 速 度 慢 、 成 本 高 
C. 容量 小 、 速 度 快 .成 本 融 D. 容量 小 .速度 慢 、 成 本 低 
4. 某 SRAM 蕊 片 的 存储 容量 为 256KX4 位 , 则 该 芯片 的 地 址 线 和 数据 线 分 别 为 (  )。 
A. 18,4 B, 4,18 (, 20,8 D. 8,20 
5. 某 机 豆 字 长 为 32 位 ,其 存储 容量 为 1IMB , 吉 按 字 编 址 , 它 的 寻 址 范围 为 ( 号 
A，1M B. 512KbB (C. 256K D, 256KPB 
6, 下 列 因素 中 ,与 cache 的 命中 率 无 关 的 是 ( 后 
A. 主 存 的 存 取 时 间 B，cache 块 的 大 小 
C，cache 的 组 织 方 式 D，cache 的 容量 
7. 下 列 说 法 中 正确 的 是 ( ) 。 
A. 多 体 交 叉 人 存储 大 主要 解决 扩充 存储 容量 问题 
B. cache 与 主 存 统一 编 址 ,cache 的 地 址 空间 是 主 存 地 址 空间 的 一 部 分 
C， cache 的 功能 全 部 由 便 件 实现 
D. 虚拟 存储 疮 的 功能 全 部 由 硬件 实现 
8. 某 容量 为 256MB 的 存储 器 ,由 若干 4MX8 位 的 DRAM 芯片 构成 ,该 DRAM 芯 ) 
的 地 址 引 肢 和 数据 引 脚 总 数 是 ( ) 。(2014 年 全 国 硕士 赋 究 生 人 学 统一 考试 计算 机 和 学科 
专业 基础 综合 试题 ) 
A, 19 B, Zz C. 30 D. 36 
9. 采用 指令 cache 与 数据 cache 分 离 的 主要 目的 是 ( )。(2014 年 全 国 硕士 人 
人 学 统一 考试 计算 机 学 科 专 业 基 础 综合 试题 ) 
A. 减低 cache 的 缺失 损失 B. 提高 cache 的 命中 率 
C. 减低 CPU 平均 访问 时 间 D. 减少 指令 流水 线 资 源 冲 突 
10. 某 计算 机 主 存 地 址 空间 大 小 为 256MB, 按 字 厄 编 址 。 虚 拟 地 址 空间 大 小 为 4GB， 
采用 页 式 存 储 管理 ,页 面 大 小 为 4KB,TLB( 快 表 ) 采 用 全 相 联 映射 ,有 4 个 页 表 项 ,内 容 如 
下 表 所 示 。 则 对 虚拟 地 址 03FF F180H 进行 虚实 地 址 变换 的 结果 是 (  ”)。(2013 年 全 国 
价 士 钱 究 生 入 学 统一 考试 计算 机 学 科 专 业 基 础 综合 试题 ) 
A. 015 3180H B, 003 5180 囊 C. TLB 上身 失 D， 献上 页 


于 


有 效 位 标记 页 框 号 
FF180H 0002H 
3FFF1H 0035H 
02FF3H 0351H 
03FFFH 0153H 


11. 下 列 关 于 因 存 (Flash Memory) 的 叙述 中 ,错误 的 是 ( )。(2012 年 全 | 
究 生 入 学 统一 考试 计算 机 学 科 专 业 基 础 综合 试题 ) 
A. 信息 可 读 可 写 , 并 且 读 、 写 速度 一 样 快 
B. 存储 元 由 MOS 管 组 成 ,是 一 种 半导体 存储 器 
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C. 抒 电 后 信息 不 丢失 ,是 一 种 非 易 失 性 存储 天 
D. 采用 随机 访问 方式 ,可 替代 计算 机 外 部 存储 器 
12. 假设 某 计 算 机 按 宇 编 址 ,cache 有 4 个 行 ,cache 和 主 存 之 间 交 换 的 块 为 1 个 字 。 
右 cache 的 内 容 初 始 为 空 , 米 用 2 路 组 相 联 映 射 方式 和 LRU 蔡 换 算法 。 当 访问 的 主 存 地 址 
依次 为 0,4,8,2,0,6,8,6,4,8 时 ,命中 cache 的 次 数 是 ( )。(2012 年 全 国 硕士 研究 生 入 
学 统一 考试 计算 机 学 科 专 业 基 础 综合 试题 ) 
A. 1 B. 2 C. 3 D. 4 


1. 简 述 存储 兹 的 物理 特性 和 逻辑 特性 ， 
2. 存储 需 与 CPU 之 间 主 要 通过 哪 几 种 信号 连接 ? CPU 对 存储 天 的 访问 主要 有 了 哪 


3. 说 明 CPU 对 存储 天 进行 谈 和 写 操 作 的 过 程 。 

4. 计算 机 存储 闫 都 有 哪些 种 类 ? 

5. 计算 机 主 存 中 为 什么 需要 包含 小 容量 的 ROM? 

6. 现代 计算 机 存储 骨 为 何 采 取 层 次 结构 ?有 了 哪 两 个 主要 层次 ?分 别 解决 什么 问题 ? 

7. 静态 人 AM 和 动态 RAM 存储 血 从 单元 电路 构成 上 来 讲 最 主要 的 不 同 在 哪里 ? 这 种 
不 同 对 这 两 种 存储 器 的 使 用 有 什么 影响 ? 

8. 某 用 户 在 进行 一 个 小 型 控制 电路 板 设 计时 需要 用 到 一 个 小 容量 的 ROM 芯片 ,在 实 
验 阶 段 , 他 需要 少量 的 ROM 心 片 做 实验 用 ,实验 成 功 后 ,他 需要 大 量 ROM 必 上 族 用 在 控制 
电路 板 上 进行 商业 销售 。 请 问 他 在 实验 阶段 和 商业 销售 阶段 分 别 使 用 什么 样 的 ROM 芯片 
比较 好 ? 

9. 有 一 个 1MX 32 位 的 存储 闫 ,由 128KX8 位 的 DRAM 已 片 ( 仿 厂 的 内 部 单元 组 成 一 
个 1024X1024 的 阵列 ) 构 成 ,试问 : 

(1) 需要 多 少 个 这 种 芯片 ? 

(2) 画 出 此 存储 冀 的 连接 图 。 

(3) 采用 逐 行 刷新 方式 , 且 要 求 单 元 刷新 间隔 不 超过 8ms, 则 刷新 周期 是 多 少 ( 即 每 间 
隅 多 长 时 间 刷 新 一 行 )? 

10. 设 CPU 有 16 根 地 址 线 ,8 根 数据 线 , 并 用 MREQ 作 访 存 控 制 信号 ( 低 电 平 有 效 )， 
用 WR 作 读 / 写 控 制 信号 (高 电 平 为 读 , 低 电 平 为 写 )。 现 有 下 列 存 储 芯 片 : IKX4 位 
RAM; 4KX8 位 RAM; 8KX8 位 RAM; 2KX8 位 ROM; 4KX8 位 ROM; 8KX8 位 
ROM 及 74LS138 译 码 顺和 各 种 门 电路 , 男 出 CPU 与 存储 带 的 连接 图 ,要求 . 

(1) 主 存 地 址 空间 分 配 : 

6000H 一 67FFH 为 系统 程序 区 ; 

6800H 一 6BFFH 为 用 户 程序 区 。 

(2) 合理 选用 上 述 存 储 忌 片 ,说 明 各 选 几 所 ? 

(3) 详细 画 出 存储 芯片 的 片 选 逮 辑 图 。 

11. 设 某 8b 的 机 器 其 地 址 总 线 为 20b, 其 1MB 的 存储 器 由 RAM 和 ROM 两 部 分 组 
成 ,其 中 ROM 占 128KB( 使 用 64K X8 的 芯片 ) ,剩余 的 为 人 AM 空间 (使 用 128KX4b 的 世 
片 ) , 试 占 


计算 机 组 织 与 结构 


(1) ROM 和 RAM 芯片 各 分 别 需 用 多 少 片 ? 

(2) 试 男 出 ROM 和 RAM 的 和 容量 扩展 图 。 

(3) 设 RAM 芯片 的 控制 信号 为 片 选 CS 和 读 写 WE,ROM 芯片 的 控制 信和 号 为 片 选 CS 和 
输出 允许 OE,CPU 对 存储 器 芯片 的 访问 控制 信号 为 RAW 和 M/IO, 试 画 出 CPU 与 RAM 
及 ROM 的 连接 图 。 

12. 某 机 天 采用 四 体 交 叉 存 储 天 , 今 执 行 一 段 循环 程序 ,此 程序 放 在 存储 天 的 连续 地 址 
单元 中 。 假 设 每 条 指令 的 执行 时 间 相 等 ,而且 不 需要 到 存储 天 中 存 取 数 据 。 请 问 在 下 面 两 
种 情况 中 ,程序 的 运行 时 间 是 否 相 同 ? 

(1) 循环 程序 由 6 条 指令 组 成 ,重复 执行 80 次 。 

(2) 循环 程序 由 8 条 指令 组 成 ,重复 执行 60 次 。 

13. 设 某 计算 机 主 存 容量 为 64MB,cache 容量 为 256KB, 主 存 和 cache 的 数据 块 大 小 为 
32B, 则 主 存 地 址 和 cache 地 址 各 为 多 少 位 ? 主 存 和 cache 之 间 交 换 的 数据 单位 是 什么 ? 在 
采取 全 相 联 映射 方式 的 情况 下 , 主 存 地 址 和 cache 地 址 格 云 分 别 是 怎样 ? 

14. 在 一 个 使 用 cache 的 机 各 中 ,CPU 执行 某 一 段 程序 共 完 成 3000 次 访 存 操作 ,其 中 
命中 cache 的 次 数 为 2420 次 。 已 知 cache 的 存储 周期 为 10ns, 主 存 存储 周期 为 80ns, 求 
cache- 主 存 系 统 的 效率 和 CPU 访问 该 存储 系统 的 平均 访问 时 间 。 

15. 设 某 机 天 的 cache 采用 4 路 组 相 联 映射 方式 ,已 知 cache 容量 为 16KB, 主 存 容量 》 
2Mb, 每 个 块 有 8 个 字 ,每 个 字 为 32b。 试 问 : 

(1) 主 存 地 址 是 多 少 位 ( 按 字 广 编 址 )? 地 址 格式 是 怎样 的 ? 

(2) 设 cache 起 始 为 空 ,CPU 从 主 存 单元 0、1、…、100 依次 读 出 101 个 字 (一 次 读 出 一 
个 字 ) ,并 重复 操作 11 次 , 问 cache 的 命中 率 为 多 少 ? 大 cache 速度 是 主人 存 的 5 倍 , 则 采用 
cache 和 不 采用 cache 速度 可 提高 多 少 售 ? 

16. 已 知 某 机 器 主 存 容量 为 256MB, 虚 存 容量 为 4GB, 试 问 虚 地 址 和 实地 址 各 为 多 少 
位 ? 如 采用 分 页 式 虚 拟人 存储 第 管理 ,每 个 页 面 为 4KB, 则 页 表 大 小 是 多 少 ? 

17. 假设 荣 机 融 中 运行 的 一 个 进程 访问 的 页 面 序 列 是 0.1.2、.4.2.3.0. 2、1.3、2 ,针对 以 
下 两 种 情况 分 别 画 出 采用 FIFO 和 LRU 替换 算法 时 的 主 存 页 面 变 化 情况 。 

(1) 主 存 有 3 个 页 面 。 

(2) 主 存 有 4 个 页 面 。 

18. 某 计 算 机 有 一 个 cache 、 主 存 和 用 于 虚拟 存储 项 的 磁盘 。 如 条 有 一 个 字 在 cache 
中 , 则 需 20ns 的 时 间 来 存 取 它 ; 如 果 字 在 主 存 而 不 在 cache 中 , 则 首先 需要 60ns 的 时 间 把 
它 调 人 cache, 然 后 再 开始 引用 ; 如 果 字 不 在 主 存 , 则 需 12ms 的 时 间 从 磁盘 中 获取 ,再 用 
60ns 把 它 存 入 cache。 设 cache 的 命中 率 为 0.9, 主 存 的 命中 率 为 0.6。 试 问 : 存 取 一 个 字 
的 平均 存 取 时 间 是 多 少 ? 

19. 某 计 算 机 主 存 按 字 节 编 址 ,人 逻辑 地 址 和 物理 地 址 都 是 32 位 ,页 表 项 大 小 为 4 字 
万 。 请 回答 下 列 问 题 。(2013 年 全 国人 硕士 研究 生 人 学 统一 考试 计算 机 学 科 专 业 基 础 综合 
试题 ) 

(1) 硅 使 用 一 级 幢 表 的 分 中 存储 管理 方式 ,人 逻辑 地 址 结构 为 


页 内 偏 移 量 (12 位 ) 
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则 页 的 大 小 是 多 少 字 节 ? 页 表 最 大 占用 多 少 字 节 ? 
(2) 若 使 用 二 级 页 表 的 分 页 存储 管理 方式 ,逻辑 地 址 结构 为 


页 目录 号 (10 位 ) | 页 表 索 引 (10 位 ) 页 内 偶 移 量 (12 位 ) 


设 逻 辑 地 址 为 LA ,请 分 别 给 出 其 对 应 的 页 目录 号 和 页 表 索 引 的 表达 式 。 

(3) 采用 (1) 中 的 分 页 存储 管理 方式 ,一 个 代码 段 起 始 逻 辑 地 址 为 00008000H ,其 长 度 
为 8KB, 被 装载 到 从 物理 地 址 00900000H 开始 的 连续 主 存 空间 中 。 页 表 从 主 存 00200000H 
开始 的 物理 地 址 处 连续 存放 ,如 图 4-56 所 示 ( 地 址 大 小 自 下 向 上 递增 )。 请 计算 出 该 代码 有 段 
对 应 的 两 个 页 表 项 的 物理 地 址 、 这 两 个 页 表 项 中 的 页 框 号 以 及 代码 页 面 2 的 起 始 物理 地 址 。 


代码 页 面 2 
物理 地 址 3 


物理 地 址 2 


理 地 址 1 0090 0000H 代码 由 夯 ] 


0020 Q000H 


图 4-56 ”页 表 
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输入 输出 系统 是 计算 机 重要 的 组 成 部 分 之 一 ,简单 地 说 ,输入 输出 系统 的 主要 功能 是 完 
成 程序 和 数据 的 输入 及 机 器 运行 结果 的 输出 。 随 着 计算 机 应 用 的 发 展 , 计 算 机 所 能 处 理 的 
数据 种 类 越 来 越 多 ,从 简单 的 数值 数据 .文本 数据 到 图 形 图 像 数据 及 音 视 频数 据 等 各 种 多 媒 
体 数 据 , 这 对 现代 计算 机 的 输入 输出 系统 提出 了 更 高 的 要 求 。 

本 章 首先 介绍 计算 机 输入 输出 系统 的 组 成 ,然后 对 计算 机 输入 输出 的 控制 方式 进行 详 
细 讨 论 , 最 后 介绍 计算 机 存储 设备 一 一 磁盘 系统 以 及 由 磁盘 阵列 组 成 的 RAID 技术 。 


5.1 输入 输出 系统 概述 


输入 输出 系统 主要 由 输入 输出 设备 和 与 CPU 相连 接 的 输入 输出 接口 逻辑 组 成 ,CPU 
通过 接口 逻辑 实现 与 输入 输出 设备 之 间 的 数据 传输 。 


5.1.1 输入 输出 设备 


上 ,除了 CPU 和 主 


亲人 输出 图 备 (Periphery) , 它 亩 善 的 面 非 常 广 
仔 外 ， 计算 机 系 4 :的 其 他 部 件 部 可 看 成 外 围 设备 。 

外 围 设备 种 类 繁多 , 随 看 计算 机 应 用 的 发 展 ,不 断 : 
讲 , 计 算 机 的 外 围 设备 可 以 分 为 以 下 5 大 类 ， 


1. 输入 设备 


输入 设备 是 指 完成 人 机 数据 输入 的 外 围 设 备 。 人 们 设计 建造 和 使 用 计算 机 的 目的 是 
让 计算 机 帮助 人 们 更 高 效 地 完成 一 定 的 功能 。 早 期 的 计算 机 最 主要 的 应 用 是 科学 计算 , 现 
代 计 算 机 的 应 用 则 深入 到 人 们 生活 的 方方面面 。 不管 人 们 要 求 计算 机 完成 什么 样 的 功能 ， 
首先 需要 将 所 编制 的 程序 和 处理 的 数据 输入 计算 机 ,而 程序 和 数据 等 的 输入 就 需要 输入 设 
备 来 完成 。 早 期 的 计算 机 是 使 用 纸 诛 读 和 人 机 等 来 完成 程序 和 数据 的 输入 的 , 键 熏 和 鼠标 是 
目前 计算 机 标准 配置 的 输入 设备 。 随 着 现代 计算 机 在 多 媒体 信息 领域 的 应 用 ,不 断 消 现 出 
各 种 用 于 多 媒体 信息 输入 的 设备 ,如 扫描 仪 .游戏 控制 杆 . 语 音 输入 设备 .图 像 输 入 设备 以 及 
各 种 音 视 频 输 和 人 设备 等 。 


2. 输出 设备 
输出 设备 是 指 完 成 人 机 数据 输出 的 外 围 设 备 。 早 期 用 于 科学 计算 的 机 融 需 要 通过 输出 


有 新 的 外 围 设备 推 向 市 场 。 一 般 来 
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设备 将 程序 运行 的 结果 以 某 种 方式 输出 给 程序 员 , 如 通过 显示 器 将 结果 显示 在 显示 屏 上 ,或 
通过 打印 机 将 结果 打印 在 打印 纸 上 等 。 而 现代 计算 机 的 输出 设备 种 类 越 来 越 丰富 ,如 用 于 
绘制 工程 图 纸 的 绘图 仪 .MPC 的 音箱 设备 以 及 各 种 音 视频 输出 设备 等 。 


3. 存储 设备 


在 第 4 章 中 讲 到 ,现代 计算 机 存储 器 采取 层次 结构 实现 , 即 由 “cache- 主 存 - 辅 存 ” 层 次 组 
成 。 按 照 现 代 计 算 机 辅 存 所 采用 的 存储 介质 分 ,主要 包括 磁 介 质 存 储 融 (磁盘 存储 项 和 磁 市 
存储 闫 ) 和 光盘 存储 项 。 可 执行 程序 在 运行 前 首先 通过 输入 设备 输入 ,并 以 文件 的 形式 存放 
在 辅 存 中 。 另 外 ,计算 机 处 理 的 各 种 信息 (数据 .文本 、 图 形 .图像 . 声 音 、 视 频 .动画 等 ) 也 均 
以 文件 的 形式 存放 在 辅 存 中 。 

由 磁盘 存储 天 、 磁 市 存储 天 或 光盘 存储 顺 构 成 的 辅 存 就 是 计算 机 的 存储 设备 ,在 机 天 
中 ,它们 是 作为 设备 由 操作 系统 进行 管理 的 。 有 关 磁 盘存 储 右 、 人 磁带 存储 器 或 光盘 存储 器 的 
内 容 将 在 5. 3 节 详 细 讲 述 。 

4. 数据 通信 设备 

计算 机 与 计算 机 之 间 的 数据 通信 有 多 种 方式 ,如 早期 的 通过 模拟 电话 线 实现 的 计算 机 
之 间 点 到 点 的 通信 ,通信 双方 要 使 用 数据 通信 设备 一 一 调制 解 调 紫 完 成 数字 信号 与 模拟 信 
号 的 转换 。 现 代 计 算 机 主要 通过 网 络 进行 数据 通信 ,每 台 计 算 机 都 是 通过 使 用 数据 通信 设 
备 一 一 网 络 适配器 (又 称 网 卡 ) 连 人 网 络 的 。 正 是 借助 各 种 数据 通信 设备 , 才 实 现 了 计算 机 
之 间 的 互联 。 


5. 过 程 探 制 设备 


计算 机 的 一 个 重要 应 用 领域 就 是 工业 控制 。 工 业 控 制 中 通 第 需要 使 用 一 些 过 程控 制 设 
备 完成 对 攻 一 工业 过 程 的 控制 。 与 上 述 列 举 的 输入 输出 设备 不 同 的 是 ,这 些 过 程控 制 设备 
往往 是 针对 一 特定 应 用 专门 设计 的 ,属于 计算 机 系统 的 非 标准 外 围 设备 。 


5.1.2 输入 输出 接口 


从 5.1.1 厄 的 讨论 看 到 ,计算 机 外 围 设备 种 类 党 多 ,而 且 互 相 之 间 差 异 很 大 ,这 些 差 寞 
主要 体现 在 以 下 几 个 方面 。 

1) 物理 特性 方面 

主要 是 指 设备 连接 的 方式 和 读 写 驱动 方式 等 ,如 连接 口 的 类 型 ,机械 尺寸 ,信号 线 的 条 
数 以 及 排列 等 。 例 如 ,打印 机 有 针 式 打印 机 激光 打印 机 、 喷 墨 打 印 机 等 ,不 同 打印 机 的 打印 
方式 各 目 不 同 ,对 打印 头 和 纸张 的 移动 的 驱动 方式 也 有 所 不 同 。 

2) 电气 特性 方面 

数据 在 信号 线 上 传递 时 ,是 以 一 定 的 电 平 值 来 表示 二 进 制 0 和 1 的。 电气 特性 定义 每 
一 条 信号 线 的 传递 方 回 和 有 效 电 平 范 围 。 有 的 设备 的 电信 和 号 使 用 的 是 TTL 电 平 标准 ,有 
的 设备 使 用 的 是 CMOS 电 平 标准 ,这 两 者 是 不 兼容 的 ,其 中 了 TITL 电路 电源 电压 使 用 的 是 
5V, 而 CMOS 电路 电源 电压 使 用 的 是 12V。 另 外 ,两 者 在 表示 逻辑 0 和 仙 辑 1 的 电 平 值 也 
是 不 相同 的 。 
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3) 功能 特性 方面 

功能 特性 定义 了 设备 连接 的 每 一 条 信号 线 的 功能 ,如 用 于 传递 数据 的 信号 线 、 用 于 传递 
地 址 的 信和 号 线 , 用 于 传递 控制 的 信号 线 等 。 尤 其 对 于 种 类 繁多 的 外 围 设备 来 说 ,不 同 的 设备 
所 需 的 控制 信号 也 各 不 相同 ,有 的 设备 与 主机 之 间 采 用 中 断 传送 方式 ,需要 中 断 控 制 信号 ， 
有 的 设备 与 主机 之 间 采 用 DMA 传送 方式 ,需要 相应 的 DMA 控制 信号 等 。 

4) 数据 格式 方面 

外 围 设备 与 主机 之 间 的 数据 传送 主要 分 为 两 种 形式 : 串 行 传送 和 并 行 传送 。 串 行 传送 
是 一 位 一 位 地 进行 的 ,而 并 行 传 送 则 是 多 位 同时 进行 的 ,不 同 的 设备 并 行 传送 的 位 数 也 会 有 
所 不 同 。 

5) 传输 速度 方面 

不 同 外 围 设 备 在 速度 上 的 差异 是 非常 明显 的 。 有 的 设备 的 剖 
兆 字 节 ( 如 磁盘 ) ,而 有 的 设备 则 只 有 几 十 字 节 甚至 更 低 。 例 如 ,和 仿 
的 速度 取决 于 人 的 手指 按键 的 速度 ,一 个 键 对 应 一 个 字 节 的 数 
速率 也 才 10B/s。 

作为 计算 机 硬件 的 核心 一 一 CPU, 从 功能 上 讲 , 它 能 够 完成 对 所 有 其 他 硬件 部 件 的 控 
制 。 这 种 控制 功能 的 实现 是 通过 CPU 尾 片 的 引出 脚 与 其 他 硬 部 件 连接 ,并 由 CPU 执行 的 
指令 产生 的 各 种 控制 信号 来 完成 的 。 但 是 ,从 上 面 讨 论 的 有 关 设 备 之 间 的 差异 可 以 看 出 ,一 
个 CPU 在 设计 时 ,无 法 做 到 与 现在 已 有 的 和 将 来 新 开发 出 来 的 各 种 不 同 的 外 围 设备 直接 
相连 。 因 此 ,计算 机 在 设计 时 ,针对 与 一 些 标准 输入 输出 设备 (这 些 设 备 往往 是 计算 机 的 标 
配 设备 ,如 输入 设备 鼠标 键盘 、 输 出 设备 显示 器 存储 设 备 人 硬盘 或 光驱 等 ) 的 连接 ,专门 在 主 
机 板 上 设计 了 相应 的 接口 电路 ,使 得 CPU 可 以 通过 这 些 接口 电路 实现 对 这 些 设 备 的 控制 。 
而 一 些 计 算 机 非 标 准 配 置 的 设备 (如 各 种 多 媒体 信息 输入 输出 设备 、 过 程控 制 设备 等 ) ,或 者 
通过 计算 机 的 一 些 标准 接口 (如 串口 ,并口 .USB 接口 等 ) 连 接 , 或 者 使 用 专门 的 设备 控制 适 
本 人 礁 与 CPU 连接 ,如 图 5-1 所 示 。 

无 论 是 与 计算 机 标准 输入 输出 设备 连接 的 标准 接口 还 是 与 计算 机 非 标准 配置 设备 连接 
的 专用 接口 统称 为 计算 机 的 输入 输出 接口 , 催 称 I/O 接口 。 也 就 是 说 ,CPU 是 通过 1/O 接 
口 与 各 种 外 围 设备 连接 的 ,并 通过 1/O 〇 接口 实现 对 外 围 设备 的 控制 功能 。 


1. 1/O 接口 的 组 成 结构 


据 传 输 速 率 高 达 每 秒 几 百 
: 盘 与 CPU 之 间 传 输 数 据 
据 ,1s 按 10 个 键 , 数 据 传 输 


不 同 设备 的 1/O 接口 在 组 成 结构 上 有 所 不 同 , 复 杂 程 度 往 往 会 差异 很 大 。 但 一 般 来 
说 ,从 I/O 接口 的 内 部 结构 看 ,在 大 多 数 1/O 接口 中 都 包含 一 些 数据 寄存 需 、 地 址 寄存 器 、 
状态 寄存 上 央 .控制 寄存 占 和 相应 的 控制 电路 。 而 且 , 为 了 控制 的 灵活 性 和 适应 性 ,很 多 IO 
接口 中 的 寄存 器 往往 是 可 编程 的 , 即 可 以 对 IO 接口 的 功能 、 工 作 方 式 、 操 作 方 式 、 数据 格 
式 等 进行 预 设置 ,以 满足 应 用 场合 的 要 求 。LI/O 接口 与 CPU 及 设备 连接 的 结构 图 如 图 5-2 
所 示 。 

1) 数据 寄存 前 

数据 寄存 需 保 和 存 CPU 与 设备 之 间 交 换 的 数据 ,又 可 以 分 成 数据 输入 寄存 船 和 数据 输 
出 寄存 顺 。 在 接口 电路 连接 输入 设备 时 ,需要 从 输入 设备 获取 数据 ,数据 从 输入 设备 出 来 就 
暂时 保存 在 数据 输入 寄存 需 ,CPU 选择 合适 的 方式 进行 谈 取 。 同 样 , 当 接 口 电 路 连接 输出 
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a EE 


] A 


输入 输出 设备 与 接口 


数据 总 线 _ | 到 《 据 


控制 总 线 CB 


5-] 


状态 


地 址 总 线 AB 控制 


地 址 寄存 兹 


图 5-2 1/O 接口 与 CPU 及 设备 连接 结构 图 


设备 时 ,CPU 发 往 输出 设备 的 数据 被 临时 保存 在 数据 输出 寄存 天 中 ,适时 到 达 输 出 设备 。 
很 多 设备 既 可 以 输入 、 又 可 以 输出 ,可 使 用 同一 个 寄存 套 或 不 同 寄存 前 与 CPU 交换 数据 。 

在 I/O 接口 中 设置 数据 寄存 器 ,一 方面 可 以 用 于 暂 存 CPU 与 设备 之 间 交 换 的 数据 ; 男 
一 方面 可 以 用 于 匹配 CPU 与 设备 之 间 的 传输 速度 差异 。 例 如 ,CPU 回 一 个 慢 速 设备 输出 
数据 ,CPU 每 次 和 首先 将 数据 送 IO 接口 中 的 数据 寄存 融 , 然 后 等 竺 IO 接口 中 的 数据 被 传 
送 给 设备 ,再 向 I/O 接口 传送 下 一 个 数据 。 另 外 ,I/O 接口 中 的 数据 寄存 器 还 起 到 CPU 与 
设备 间 数 据 格式 的 转换 工作 。 例 如 ,与 CPU 连接 的 是 一 个 串 行 输出 设备 , 则 CPU 每 次 将 
一 个 并 行 数据 ( 字 节 或 字 ) 先 送 至 IO 接口 数据 寄存 右 , 由 W/O 接口 控制 将 数据 寄存 器 中 的 
数据 一 位 一 位 地 移 位 送 往 设备 。 

2) 状态 寄存 器 
状态 寄存 套用 于 保存 设备 当前 的 工作 状态 信息 。CPU 与 设备 交换 数据 ,弟弟 需要 了 解 
设备 当前 的 工作 状态 ,以 便 决 定 是 否 继 续 与 设备 进行 数据 的 交换 。 例 如 ,CPU 与 慢 速 的 设 
备 进行 数据 交换 时 , 若 CPU 只 顾 按 自己 的 速度 发 送 ,而 不 管 设备 是 否 有 能 力 接 收 , 则 会 导 
致 传输 数据 的 丢失 。 通 过 在 I/O 接口 中 设置 状态 寄存 器 ,及 时 地 将 设备 的 状态 反映 给 
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CPU ,使 CPU 能 够 按照 设备 的 接收 能 力 或 速度 传输 数据 。 

3) 控制 寄存 着 

控制 寄存 器 用 于 保存 CPU 对 W/O 接口 电路 和 设备 进行 控制 或 操作 的 相关 信息 。 对 于 
可 编程 的 IO 接口 来 说 ,第 第 有 多 种 工作 方式 或 操作 模式 等 可 以 选择 ,CPU 通过 回 控制 寄 
存 器 写 人 相应 的 控制 字 实 现 对 1/O 接口 及 设备 工作 方式 等 的 预 设置 。 

4) 地 址 寄存 颖 

在 有 些 IO 接口 中 还 设置 地 址 寄存 右 , 例 如 ,在 CPU 与 磁盘 采用 DMA 数据 传送 方 
式 的 DMA 接口 电路 中 ,就 设置 了 地 址 寄存 器 ,其 初始 值 由 CPU 预 置 ,指出 与 磁盘 进行 块 数 
据 交 换 的 主 存 空间 首 地 址 ,然后 在 DMA 接口 (又 称 DMA 控制 器 ) 的 控制 下 ,完成 块 数据 
交换 。 


2. I/ 接口 的 功能 


1/O 〇 接口 从 简单 到 复杂 ,实现 的 功能 各 不 相同 。 一 般 来 讲 ,1/O 接口 的 功能 包括 以 下 几 
个 方面 。 

1) 数据 的 寄存 和 缓冲 

1/QO 接口 中 设置 的 数据 寄存 前 ,一 方面 起 到 数据 和 暂 存 的 作用 ; 为 一 方面 起 到 
的 作用 。I/O 接口 的 数据 缓冲 用 于 匹配 快速 的 CPU 与 相对 慢 速 的 设备 之 间 的 数据 交换 。 
例如 ,很 多 打印 机 是 通过 计算 机 的 并 行 接口 与 主机 相连 的 ,在 主机 板 的 并 行 接口 电路 里 设置 
了 数据 缓冲 寄存 器 ,同时 打印 机 内 部 的 控制 电路 也 设计 有 一 个 数据 缓冲 区 ,CPU 传送 来 的 
打印 数据 痛 先 被 送 到 并 行 接口 电路 的 数据 寄存 带 中 缕 存 ,然后 再 传送 到 打印 机 的 数据 缓冲 
区 ,打印 机 的 控制 电路 控制 打印 机 按照 一 定 的 打印 速度 从 数据 缓冲 区 中 取出 数据 打印 。 

2) 对 设备 的 控制 和 监测 

一 方面 1/O 〇 接口 能 多 


数据 缓冲 


多 接收 来 自 CPU 的 控制 命令 ,进行 解释 分 析 , 生 成 对 设备 的 控制 信 
号 ; 男 一 方面 1/O 接口 能 够 对 设备 的 工作 状态 进行 实时 监控 ,并 随时 将 设备 的 状态 提供 给 
CPU 查询 等 。 

3) 对 设备 的 寻 址 

一 个 计算 机 系统 中 的 外 于 设备 很 多 ,CPU 对 设备 的 访问 也 是 通过 地 址 的 方式 进行 的 。 
在 IO 接口 电路 里 ,除了 一 些 寄存 顺和 控制 电路 外 ,还 往往 有 地 址 译 码 电路 ,CPU 通过 I/O 
接口 中 的 地 址 详 码 电路 完成 对 设备 的 寻 址 和 访问 。 

4) 信号 变换 

外 围 设 备 大 都 是 复杂 的 机 电 设 备 , 其 所 需 的 控制 信号 和 所 能 提供 的 状态 信号 往往 同 
CPU 的 引 脚 信和 号 不 菲 容 ,这 包括 信号 使 用 的 电 平 标准 ,信号 的 时 序 逻 辑 关 系 及 数据 格式 等 。 
因此 ,1/O 接口 必须 完成 CPU 与 设备 之 间 的 这 种 信号 转换 功能 ,使 CPU 与 设备 能 进行 正常 
的 连接 和 通信 。 

在 微型 计算 机 系统 中 ,有 些 W/O 接口 是 以 标准 芯片 的 方式 
具有 可 编程 功能 ,以 满足 不 同 用 户 在 不 同 应 用 场合 的 需要 。 


5.1.3 输入 输出 设备 的 编 址 与 管理 
在 第 4 章 讲 到 ,CPU 对 存储 器 的 组 织 管 理 采 用 的 是 编 址 方式 , 即 为 每 个 存储 单元 分 配 


是 供用 户 使 用 的 ,它们 往往 
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一 个 唯一 的 地 址 ,CPU 通过 给 出 单元 地 址 访问 相应 的 存储 单元 。 在 一 个 计算 机 系统 中 ,所 
拥有 的 各 种 输入 输出 设备 和 存储 设备 很 多 ,在 这 些 设备 以 及 设备 的 IO 接口 中 有 很 多 可 供 
CPU 访问 的 寄存 融 ,这些 不 同 种 类 的 寄存 各 称 为 W/O 端口 (Port)。CPU 对 IO 端口 的 访 
问 采 用 的 是 与 访 存 类 似 的 按 地 址 访问 方式 , 即 为 每 一 个 LO 关口 分 配 一 个 地 址 ,又 称 为 IO 
地 址 或 W/O 端口 号 ,CPU 通过 给 出 IO 端口 地 址 访问 相应 的 IO 端口 ,也 即 访问 相应 的 
CPU 对 WO 站 口 的 编 址 方式 主要 有 两 种 : 一 是 独立 编 址 方式 ; 二 是 统一 编 址 方式 。 


1. 1/ 请 口 的 独立 纺 址 万 陈 


独立 编 址 方式 是 指 系 统 使 用 一 个 不 同 于 主 存 地 址 空间 之 外 的 单独 的 地 址 空间 ,为 外 围 
设备 及 接口 中 的 所 有 1/O 端口 分 配 W/O 地址 ,如 图 5-3(a) 所 示 ，。 


00000H 00000H 


主 存 


EFFFFH 
UUUU FUUUU 日 


FFFFFEH FFFEH FFFFFH 


(a) 独立 编 址 (b) 统一 编 址 
图 5-3 ”I/O 端口 的 编 址 方式 


IBM PC 等 系列 计算 机 设置 有 专门 的 1/O 指令 ,设备 的 编 址 可 达 512 个 ,部 分 设备 的 地 
址 码 如 表 5-1 所 示 。 每 种 设备 占用 了 符 干 个 地 址 码 ,分 别 表 示 相 应 的 设备 控制 锅 中 的 各 个 
寄存 器 地 址 ,各 个 寄存 器 的 地 址 码 不 能 重复 ,具有 唯一 性 。 

表 S-1 输入 输出 设备 地 址 分 配 表 
输入 输出 设备 占用 地 址 数 地 址 码 (十 六 进 制 ) 
硬盘 控制 需 16 320 一 32FH 
软盘 控制 器 8 3F0~3F7H 
单 色 显示 器 /并 行 打印 机 16 3B0 一 3BFH 
彩色 图 形 显示 顺 16 3D0~3DFH 
异步 通信 控制 兹 8 3F8~3FFH 


在 这 种 方式 下 ,CPU 指令 系统 中 有 专门 的 用 于 与 设备 进行 数据 传输 的 输入 输出 指令 ， 
对 设备 的 访问 必须 使 用 这 些 专用 指令 进行 。 例 如 ,x86 系列 的 CPU 有 两 条 专用 输入 输出 指 
令 为 

IN AL,PORT; 输入 指令 一 一 将 1/O 端口 Port 中 的 内 容 传送 到 AL 寄存 器 中 。 

OUT PORT ,AL; 输出 指令 一 一 将 AL 寄存 器 中 的 内 容 传送 到 I/O 端口 Port 中 。 

执行 IN 指令 时 ,CPU 的 IJVO 读 取 IOR 信 号 有 效 , 产 生 IVO 读 取 总 线 周期 ; 执行 OUT 
指令 时 ,CPU 的 I/O 写 IO 双 信号 有 效 ,产生 1/O 写 总 线 周 期 。 
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独立 编 址 方式 的 优点 : 一 是 W/O 端口 的 地 址 没有 占用 主 存 的 地 址 空间 ; 二 是 IO 端口 
的 地 址 码 较 短 ,地 址 译 码 融 设 计 及 实现 简单 , 译 码 时 间 也 较 短 。 其 缺点 是 : 只 能 使 用 专用 输 
入 输出 指令 访问 I/O 设备 ,对 IO 设备 操作 的 程序 设计 灵活 性 较 差 。 


2. 1/0 端口 的 统一 编 址 方式 
统一 编 址 方式 是 指 1/O 端口 与 主 存单 元 使 用 同一 个 : 


也 址 空间 进行 统一 编 址 ,如 图 5-3(b) 


在 这 种 方式 下 ,CPU 指令 系统 中 无 须 设置 专门 的 与 设备 进行 数据 传输 的 输入 输出 指 
令 ,1/O 病 口 被 当成 主 存 单元 同样 对 等 ,对 主 存单 元 进行 访问 和 操作 的 指令 可 以 同样 用 于 对 
IO 坑口 的 访问 和 操作 。 

完 一 编 址 方式 的 优点 : 可 以 使 用 访 存 指令 访问 I/O, 对 1/O 设备 操作 的 程序 设计 灵活 
性 较 好 。 其 缺点 是 : W/O 奖 口 的 地 址 占用 了 主 存 的 部 分 地 址 空间 ,对 IO 奖 口 访问 的 地 址 
泽 码 更 加 复杂 。 


和 入 输出 控制 方式 


从 前 面 的 讨论 大 家 已 经 了 解 到 ,不 同 的 设备 在 很 多 方面 都 存在 差异 ,因此 ,作为 机 天 的 
输入 输出 系统 来 说 ,必须 针对 不 同 的 设备 采取 不 同 的 输入 输出 控制 方式 ,以 最 大 程度 发 挥 主 
机 CPU 和 设备 的 效率 。 


5.2.1 程序 控制 方式 


程序 控制 方式 是 指 主机 与 设备 间 的 数据 传输 是 通过 CPU 执行 一 段 软件 程序 ,在 程序 
的 控制 下 完成 输入 输出 操作 。 程 序 控 制 方式 根据 设备 的 不 同 又 分 为 无 条 件 传 送 控制 方式 和 
查询 式 传送 控制 方式 。 


1. 无 条 件 传达 控制 方式 


有 些 简 单 设备 ,如 发 光 二 极 管 (Light-Emitting Diode,LED) 和 数码 管 、 按 键 及 开关 等 ， 
它们 的 工作 方式 十 分 商 单 ,相对 CPU 而 言 , 其 状态 很 少 发 生变 化 。 例 如 ,数码 管 , 只 要 CPU 
将 数据 传 给 它 ,就 可 立即 获得 显示 ; 又 如 电子 开关 ,其 状态 或 者 为 财 合 或 者 为 打开 ,CPU 可 
以 随时 对 其 状态 进行 读 取 。 因 此 , 当 这 些 设 备 与 CPU 交换 数据 时 ,可 以 认为 它们 总 是 处 于 

无 沦 什 生出 无 条 件 输入 ” 就绪 (Ready) 状 态 , 随 时 可 以 进行 数据 传送 ,这 就 是 无 条 件 
传送 ,有 时 也 称 它 为 立即 传送 或 同步 传送 ,其 程序 控制 流程 
如 图 5-4 所 示 。 

I Ne 用 于 无 条 件 传送 的 1/O 接口 电路 十 分 简单 ,接口 中 内 

考虑 数据 缓冲 ,不 考虑 信号 联络 。 实 现 数 据 缓 冲 的 器 件 可 
以 是 三 态 缓冲 需 或 锁 和 存 佣 。 

图 5-5 给 出 了 一 个 无 条 件 输 入 输出 的 接口 例子 ,其 中 
5-4 ”无条件 传送 程序 控制 流程 无 条 件 输入 接口 电路 连接 一 个 开关 电路 ,无 条 件 输出 接口 
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电路 连接 发 光 二 极 管 (CLED) 。 

三 态 缓 冲 吉 74LS244 构成 数据 输入 端口 , 它 连 接 8 个 开关 开 , 一 K, ,开关 的 输入 端 通过 
电阻 连 到 高 电 平 上 , 另 一 疹 接 地 。 这 样 , 当 开关 打开 时 缓冲 项 输 入 冰 为 高 电 平 (逻辑 1); 开 
关闭 合 时 缓冲 需 输 入 低 电 平 ( 逻 辑 0)。 
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到 5-5 无 条 件 传送 


当 CPU 执行 输入 指令 时 ,产生 读 控 制 IOR 信 号 低 有 效 。 译 码 输 出 和 读 控 制 同时 低 有 
效 , 使 得 三 态 缓 冲 冀 控制 辆 低 有 效 ; 开关 的 当前 状态 被 三 态 缓冲 着 传输 到 数据 总 线 D; 一 
D。 ,进而 传送 给 CPU ,其 中 某 位 D; 王 0, 说 明 开 关 K; 闭合 ; D; 王 1, 说 明 开关 K; 断 开 。 

8 位 锁 存 器 74LS273( 无 = 态 控制 ) 构 成 数据 输出 端口 。 当 其 时 钟 控制 端 CLK 出 现 上 
升 沿 时 锁 存 数据 ,被 锁 存 的 数据 输出 ,经 反 相 驱 动 咽 74LS06 驱动 8 个 发 光 二 极 管 (Li 一 Lv ) 
发 光 。74LS06 是 集 电 极 开路 (OC) 输 出 , 它 的 每 个 输出 线 需 要 通过 电阻 挂 到 高 电 平 上 。 当 
CPU 的 某 个 数据 总 线 D; 输出 高 电 平 (逻辑 1) 时 ,经 反 相 为 低 电 平 接 到 发 光 二 极 管 L; 负极 ， 
发 光 二 极 管 正 极 接 高 电 平 。 这 样 ,二 极 管 形成 导 通 电流 ,发 光 二 极 管 L; 将 点 亮 。 当 CPU 输 
出 D; 低 电 平 ,对 应 发 光 二 极 管 L; 不 会 导 通 ,将 不 发 光 。 

当 CPU 执行 输出 指令 时 ,产生 写 控 制 IOW 信 号 低 有 效 。 译 码 输出 和 写 控 制 同时 低 有 
效 ,使 得 8 位 锁 存 顺 控 制 输入 CLK 为 低 ; 经 过 一 个 时 钟 周 期 , 译 码 输出 或 写 控 制 无 效 将 使 
得 CLK 恢复 为 高 。 在 CLK 的 上 升 沿 ,8 位 锁 存 器 将 锁 存 此 时 出 现在 其 输入 只 ,由 CPU 传 
送 到 数据 总 线 D; 一 Du 上 的 输出 数据 ,控制 发 光 二 极 管 的 发 光 和 不 发 光 。 


2. 得 询 陈 传达 控制 方式 


查询 式 传 送 控制 方式 也 称 为 异步 传送 , 它 是 指 当 CPU 需要 与 外 围 设备 交换 数据 时 ,首先 
查询 设备 的 状态 ,只 有 在 设备 准备 就 绪 时 才 进 行 数据 传输 。 与 无 条 件 传 送 方式 相 比 ,查询 式 传 
送 增加 了 一 个 传送 前 查询 设备 状态 的 环节 。 查 询 式 输 入 和 输出 程序 控制 流程 如 图 5-6 所 示 。 
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合 询 式 策 出 各 调式 条 人 


但 启 议 备 状 仿 得 询 区 备 状 候 


”Ready? J 
| 
和 戎 人 一 个 效 捐 


图 5-6 查询 式 传送 程序 控制 流程 


1) 查询 式 输入 接口 

如 图 5-7 所 示 是 一 个 来 用 查询 方式 输入 数据 的 1/O 接口 电路 示意 图 。 图 中 8 位 锁 存 各 
与 8 位 三 态 缓冲 需 构 成 数据 输入 寄存 项 , 即 数据 端口 。 它 一 侧 连 接 输入 设备 , 另 一 侧 连 接 系 
统 的 数据 总 线 。1 位 锁 存 希 和 1 位 三 态 缓 冲 需 构成 状态 寄存 需 , 即 状态 端口 ,其 输出 妆 连 接 


ww ~ ho 


5-7 查询 式 输 人 接口 


在 输入 设备 通过 选 通信 号 STB 将 数据 送 入 数据 寄存 器 的 同时 ,将 D 触发 器 置 1( 因 为 其 
输入 端 万 总 是 为 高 电 平 ) ,说 明 数 据 寄存 器 中 已 经 有 设备 送 来 的 数据 ,可 以 提供 给 CPU 读 
取 ,也 就 是 表示 设备 就 绪 。 

CPU 可 以 随时 读 取 状态 端口 来 查询 设备 的 状态 。 如 果 Du = 一 1 ,说明 输入 数据 已 就 绪 ， 
此 时 ,CPU 读 取 数据 端口 便 得 到 设备 提供 的 数据 。 读 取 数 据 产生 的 控制 信号 ,还 被 连接 到 
触发 锅 的 尺 复位 端 ( 低 电 平 有 效 ) ,该 复位 信号 将 触发 希 输出 Q 置 为 0, 表 示 数 据 已 被 取 
走 。 如 果 检 测 到 D, =0 ,说 明 输 入 数据 尚未 就 绪 ,程序 应 继续 查询 。 

2) 查询 式 输出 接口 

如 图 5-8 所 示 是 一 个 采用 查询 方式 输出 数据 的 接口 电路 示意 图 。8 位 锁 存 器 构成 数据 
输出 寄存 器 , 即 数 据 端 口 , 它 一 侧 连 接 系 统 的 数据 总 线 , 男 一 侧 连 接 输 出 设备 。1 位 锁 存 器 
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5-8 查询 式 输出 接口 


当 CPU 要 输出 数据 时 ,首先 查询 状态 问 口 。 夺 D; 二 0, 表 示 设 备 准 备 就 绪 可 以 接收 数 
据 。 此 时 ,CPU 可 将 数据 写 入 数据 端口 , 写 人 数据 产生 的 控制 信号 也 作为 DD 触发 器 的 控制 
信号 , 尼 将 D 触发 着 置 1, 以 便 通 知 外 围 设备 接收 数据 。 夺 D; 二 1, 说 明 接 口 电 路 中 的 上 一 
数据 尚 没 有 被 设备 取 走 ,CPU 不 能 送 下 一 个 数据 ,而 只 能 继续 查询 设备 状态 ,直到 设备 准 


[发 
备 就 绪 。 

输出 设备 可 根据 状态 锁 存 硕 的 输出 信号 Q 接收 数据 。 奢 为 1, 表示 CPU 已 送 来 一 个 数 
据 ,于 是 ,设备 可 以 从 数据 寄存 器 中 将 数据 取出 ,并 待 数据 处 理 结束 时 ,给 出 应 答 信 号 ACK， 
该 信号 将 状态 寄存 器 重新 复位 为 0, 表 示 设 备 准备 就 绪 , 可 以 接收 下 一 个 数据 了 。 


5.2.2 ”中 断 控制 方式 


上 述 的 程序 控制 方式 对 于 在 单 用 户 单 道 程序 系统 环境 下 对 简单 设备 的 输入 输出 控制 是 
有 效 的 。 在 这 种 环境 下 ,用 户 程序 可 以 占用 全 部 系统 资源 ,包括 CPU、 存 储 器 和 输入 输出 设 
备 。 当 用 户 程序 需要 进行 输入 输出 操作 时 ,CPU 执行 用 户 的 输入 输出 程序 ,控制 与 设备 的 
数据 交换 。 但 是 ,在 多 用 户 多 道 程序 系统 中 , 若 仍 采 用 这 种 控制 方式 , 某 一 道 程序 需要 占用 

时 序 只 能 等 待 ,这 对 CPU 这 一 宝贵 资源 将 是 极 大 的 浪费 。 
准备 就 绪 的 空置 状态 , 另 一 方面 其 他 程序 因 得 不 到 CPU 而 不 能 运行 ,使 得 CPU 的 有 效 利 
用 率 很 低 。 为 解决 这 种 矛盾 ,计算 机 设计 者 提出 了 中 断 控制 方式 。 


1. 中 断 的 基本 概念 中 断 服 务 


主 程序 程序 
老师 正在 教室 上 课 ,一 位 迟到 的 学 生 推 门 进 来 ,老师 停 下 正 

在 讲 的 课 , 目 送 看 学 生 在 座位 上 就 坐 , 然 后 继续 上 课 , 这 一 过 程 

就 是 中 断 。 中 断 请 求 _ 
对 于 计算 机 系统 来 说 ,中 断 是 指 CPU 正在 运行 一 个 程序 时 

发 生 了 某 种 非 预 期 的 事件 ,CPU 暂停 正在 运行 的 程序 , 转 而 执 

行 对 这 一 事件 进行 处 理 的 程序 ( 称 为 中 断 服务 程序 ) ,完成 后 再 

返回 原 程 序 继续 运行 的 过 程 ,如 图 5-9 所 示 。 图 5-9 中 断 的 概念 
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引起 中 断 的 事件 称 为 中 断 源 。 对 于 计算 机 系统 来 说 ,中 断 源 分 为 外 部 中 断 和 内 部 中 断 。 
外 部 中 断 主 要 是 指 由 计算 机 外 围 设 备 、 系统 定时 时 钟 及 人 工 干 预 等 外 部 事件 引起 的 中 断 , 通 
过 设备 产生 的 外 部 中 断 , 能 使 CPU 与 设备 间 进 行 中 断 方式 的 数据 传输 ,这 也 是 本 小 节 主 要 
讲述 的 内 容 。 内 部 中 断 主要 包括 指令 中 断 和 故障 中 断 。 指 令 中 断 是 由 软件 指令 引起 的 , 设 
置 指 令 中 断 的 目的 通常 是 为 用 户 程序 提供 对 系统 资源 的 访问 ,例如 ,x86 CPU 指令 系统 提 
oy 条 软 中 断 指令 INT ,执行 该 指令 后 ,系统 会 转 人 执行 一 段 驻 留 在 主 存 中 的 系统 程序 
该 程序 主要 完成 对 系统 某 一 资源 的 访问 服务 。 故障 中 断 主要 是 指 由 系统 软 硬 件 故障 引起 的 
中 断 , 如 内 存 校 验 故 障 、 电 源 掉 电 、 除 去 错误 、 算 术 光 出、 内存 越界 .指令 非法 .虚拟 存储 毅 页 
面 失效 等 。 计 算 机 中 断 源 的 类 型 归纳 总 结 如 图 5-10 所 示 。 
2. 中 断 控制 的 基本 原理 pi 部 中 断 | i 
前 面 已 经 提 到 ,程序 控制 方式 在 多 道 程序 系统 中 会 外 部 中 断 -外 部 设备 中 断 竺 
因为 某 一 程序 长 时 间 占 用 CPU 进行 输入 输出 操作 而 当 ”图 5-10 计算 机 中 断 源 的 类 型 
如 CPU 资源 ,而 中 断 控 制 方式 则 可 以 有 效 提高 CPU 利 
用 率 。 下 面 通 过 对 比 程序 控制 方式 和 中 断 控 制 方式 下 CPU 控制 打印 机 打印 输出 的 过 程 ， 
阐述 中 断 控 制 的 基本 原理 . 
图 5-11(a) 和 图 5-11(b) 分 别 给 出 了 程序 控制 方式 和 中 断 
机 的 打印 输出 过 程 。 
主 程序 查询 等 待 查询 等 竺 查询 等 待 


室 制 方式 这 两 种 方式 下 打印 


(CPU | 
人 启动 发 送 发 类 
J/O 类 类 位- 
准备 。 “打印 扩印 
设备 空闲 就 绪 就 结 | 
接收 接收 
数据 数据 
(a) 程序 控制 万 式 
主 程序 主 程序 主 程序 i 
CPU 中 晰 4 中 晰 
人 启动 响应 发送 吧 应 ”发送 
To 数 装 据 
准备 打印 < 打印 
设备 空闲 中 断 PW A 
请 求 ”接收 请 求 ”接收 
数据 数据 
(b) 中 断 控制 方 式 


制 方式 和 中 断 控制 方式 下 打印 输出 的 过 程 对 比 


图 5-11 “程序 # 


从 图 5-11 可 以 看 出 ,在 程序 控制 方式 下 , 当 CPU 执行 的 一 个 主 程序 要 打印 输出 数据 
时 ,首先 启动 打印 机 ,使 打印 机 进入 打印 准备 工作 状态 。 在 打印 机 准备 的 过 程 中 ,CPU 一 直 


处 于 查询 等 竺 状态 , 即 查询 打印 机 是 否 准备 就 绪 。 当 CPU 查询 到 打印 机 已 做 好 打印 准备 


时 , 便 向 打印 机 传送 第 一 个 数据 ， 打印 机 接收 到 该 数据 后 进行 J 打印 。 在 打印 机 打印 的 过 程 
据 后 ,可 以 接收 下 一 个 数据 


中 ,CPU 又 开始 进入 查询 等 每 状态 ,等 到 打印 机 打印 完 一 个 郑 
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时 ,CPU 再 向 打印 机 发 送 下 一 个 数据 。 如 此 重复 ,直到 将 所 有 数据 打印 完 。 一 般 来 讲 ,CPU 
回 打 印 机 传送 一 个 数据 的 时 间 远 比 打印 机 打印 一 个 数据 所 花 的 时 间 少 得 多 ,而 在 上 述 过 程 
中 , 当 打 印 机 进行 打印 操作 时 ,CPU 一 直 在 执行 一 段 查询 打印 机 状态 的 循环 控制 程序 ,无 法 
执行 其 他 程序 ,这 对 CPU 资源 是 极 大 的 浪费 。 

而 在 中 断 控制 方式 下 ,情况 就 不 一 样 了 了 。 当 CPU 执行 的 一 个 主 程序 要 打印 输出 数据 
时 ,首先 启动 打印 机 ,使 打印 机 进入 打印 准备 工作 状态 。 在 打印 机 准备 的 过 程 中 ,CPU 可 以 
由 系统 调度 去 执行 其 他 主 程序 。 当 打印 机 做 好 打印 准备 时 , 回 CPU 发 出 一 个 中 断 请 求 信 
号 ,CPU 接收 到 该 请 求 后 ,暂停 正在 执行 的 主 程序 , 回 打 印 机 传送 一 个 数据 ,然后 返回 被 中 
断 的 主 程序 继续 执行 。 打 印 机 接收 到 数据 后 进行 打印 ,打印 完成 后 ,又 回 CPU 发 出 中 断 请 
求 ,CPU 啊 应 中 断 , 回 打印 机 传送 下 一 个 数据 进行 打印 。 如 此 重复 ,直到 将 所 有 数据 打印 
完 。 从 这 一 过 程 可 以 注意 到 ,在 打印 机 打印 的 同时 ,CPU 可 以 被 调度 执行 其 他 主 程序 , 而 无 
须 查 询 等 待 ,使 CPU 的 利用 率 得 到 了 提高 。 

通过 对 以 上 两 种 不 同 控制 方式 控制 打印 机 打印 输出 的 过 玫 
同 之 处 : 

(1) 程序 控制 方式 下 ,CPU 是 通过 查询 方式 了 解 打印 机 的 状态 的 ; 而 中 断 控 制 方式 下 ， 
CPU 是 通过 中 断 方式 了 解 打印 机 的 状态 的 。 

2) 程序 控制 方式 下 ,CPU 和 打印 机 之 间 是 串 行 工作 的 ; 而 中 断 控制 方式 下 ,CPU 和 
打印 机 可 以 并 行 工作 。 

(3) 程序 控制 方式 对 于 单 用 户 单 道 程序 系统 来 说 是 有 效 的 ; 而 中 断 控 制 方式 对 于 多 用 
户 多 道 程序 系统 来 说 可 以 大 大 提高 CPU 的 利用 率 。 


3. 中 断 处 理 过 程 


一 个 中 断 的 处 理 过 程 是 由 中 断 源 的 中 断 请 求 引 起 的 。 在 一 个 实现 了 中 断 系 统 功能 的 机 
艇 中 ,CPU 在 执行 一 个 主 程序 时 ,每 执行 完 一 条 指令 部 会 检查 是 否 有 中 断 请 求 发 生 , 夺 没 
有 , 则 继续 执行 原 程 序 , 硅 有 , 则 在 条 件 满足 的 情况 下 ,暂停 正在 执行 的 程序 ,对 中 断 请 求 进 
行 啊 应 。 在 中 断 啊 应 过 程 中 ,中 断 系 统 要 识别 是 哪 一 个 中 断 源 发 出 的 中 断 请 求 , 在 有 多 个 中 
断 源 同 时 发 出 中 断 请 求 的 时 候 还 要 决定 首先 啊 应 哪 一 个 中 断 源 的 请 求 。 在 确定 了 要 啊 应 的 
中 断 源 后 ,进入 对 该 中 断 源 的 中 断 请 求 进行 处 理 的 中 断 服务 程序 去 执行 ,执行 完成 后 返回 原 
来 被 中 断 的 程序 继续 执行 。 中 断 系 统 的 中 断 处 理 过 程 如 图 5-12 所 示 。 


主 程序 指令 | 中 断 响应 | 
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中 所 服务 理 
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主 程序 指令 中 断 返 回 
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图 5-12 ”中 断 人 处 理 过 程 
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1) 中 断 请 求 的 建立 

CPU 在 设计 时 ,其 对 外 引 脚 通常 会 有 一 条 或 多 条 来 日 中 断 源 的 中 断 请 求 信 号 线 ,CPU 
通过 对 这 些 引 脚 信号 的 状态 来 判别 是 否 有 外 部 中 断 源 中 断 请 求 的 发 生 。 例 如 ,8086/8088 
CPU 有 两 条 引 脚 INTR 和 NMI, 其 中 INTR(INTerrupt Request) 主 要 用 于 定时 时 钟 和 外 
围 设 备 中 断 源 的 中 断 请 求 ,NMICNon-Masked Interrupt) 用 于 一 些 系 统 便 件 故 障 中 断 源 的 
中 上 断 请 求 等 。 

在 中 断 系统 中 ,外 部 中 断 源 及 硬件 故障 中 断 源 的 中 断 请 求 是 由 便 件 实现 的 , 当 茶 中 
断 源 要 加 CPU 发 出 中 断 请 求 时 ,首先 通过 便 件 方式 为 其 建立 和 保持 一 个 中 断 请 求 信和 号。 
通常 是 在 其 中 汤 接 口 电路 里 设置 一 个 中断 请 求 触 发 条”, 当 中 断 源 有 中 断 请 求 时 (对 设 
备 来 说 就 是 设备 准备 就 缚 ,对 故障 中 断 源 来 说 就 是 发 生 了 便 件 故障 ) ,将 接口 中 的 中 断 请 
求 触 发 硕 置 位 ,中 断 请 求 触 发 天 的 输出 将 作为 发 往 CPU 的 中 断 请 求 信 号 ,如 图 5-13(a) 
所 示 。 

为 了 控制 的 灵活 性 ,通常 在 中 断 接 口 电路 中 还 会 设置 一 个 中 断 屏 蔽 触发 大 , 其 作用 是 对 
中 断 源 的 中 断 请 求 进 行 屏 若 和 开放 。 中 断 系统 允许 在 程序 中 对 中 断 屏 蔽 和 甬 发 希 进 行 设 置 ， 
以 决定 在 程序 的 执行 过 程 中 哪些 中 断 源 人 允许 请 求 中 断 ,哪些 中 断 源 不 允许 请 求 中 断 , 如 
图 5-13(b) 所 示 。 


"El 


中 断 请 求 


中 断 接口 中 断 接口 
(a) 发 出 中 断 请 求 信 和 号 (b) 中 上 断 屏 向 处 理 
图 5-13 ”中 断 请 求 与 中 断 屏 蔽 


在 一 个 机 器 系统 中 ,往往 有 多 个 中 断 源 ,将 这 些 中 断 源 的 中 断 请求 触 发 需 合 在 一 起 便 构 
成 了 一 个 中 断 请 求 寄存 器 ,而 这 些 中 断 源 的 中 断 屏蔽 触发 器 合 在 一 起 构成 了 一 个 中 断 屏 贡 
寄存 器 。 其 中 ,中 断 屏 蔽 寄存 器 作为 1/O 端口 可 供 CPU 访问 ,在 程序 中 通过 将 一 个 中 断 屏 
蔽 字 写 入 该 端口 , 便 可 实现 对 中 断 源 的 屏蔽 和 开放 功能 。 

2) 中 上 断 啊 应 

CPU 在 其 中 断 请 求 线 上 检测 到 外 部 中 断 源 的 中 断 请 求 时 ,并 不 是 都 会 给 予 啊 应 的 。 通 
第, 大 多 数 CPU 内 部 都 设置 了 一 个 中 断 允许 触发 磊 , 该 触发 龙 的 作用 是 对 中 断 请 求 线 上 来 
的 中 断 请 求 进 行 禁 止 和 允许。 中 断 人 允许 触发 器 可 以 通过 CPU 提供 的 指令 进行 设置 ,例如 ， 
8086/8088 CPU 提供 了 两 条 指令 STI 和 CLI, 前 一 条 指令 称 为 开 中 断 指 令 ,用 于 将 CPU 内 
部 的 中 断 人 允许 触 发 着 置 1, 即 中 断 允 许 或 开 中 断 ; 后 一 条 指令 称 为 关中 上 断 指 令 ,用 于 将 中 断 
人 允许 触发 部 清 0, 即 中 断 禁 止 或 关中 断 。 在 CPU 处 于 中 断 允许 状态 时 ,可 以 对 来 自 中 汤 请 
求 线 上 的 中 断 请 求 进行 啊 应 ; 而 CPU 处 于 中 断 茜 止 状态 时 , 则 对 来 日 中 断 请 求 线 上 的 中 断 
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请 求 不 予 啊 应 。 

当然 ,并 不 是 所 有 中 断 源 的 中 断 请 求 都 能 被 CPU 禁止 的 ,尤其 是 一 些 比较 紧迫 的 事件 
的 中 断 ,如 因 电 源 掉 电 、 内 存 校 验 出 错 等 导致 的 硬件 故障 中 断 ,CPU 必须 立即 啊 应 。 因 此 ， 
多 数 CPU 在 引 肢 设计 上 会 设置 多 条 中 汤 请 求 信 号 线 , 一 些 用 于 可 屏蔽 的 中 断 请 求 ,一 些 用 
于 非 屏蔽 的 中 断 请 求 ( 如 8086/8088 CPU 的 INTR 和 NMDI) 。 

一 旦 CPU 啊 应 了 中 断 , 便 进入 中 断 啊 应 周期 。 在 中 断 啊 应 周期 里 ,中 断 系 统 主 要 完成 
以 下 三 项 功能 : 

(1) 关中 断 和 保护 断 点 。CPU 啊 应 中 断 时 ,会 和 目 动 执行 一 条 中 断 隐 指 令 ,一 方面 将 中 
断 人 允许 触发 器 清 零 , 即 关中 断 ; 另 一 方面 将 CPU 内 部 的 指令 指针 和 程序 状态 字 (PSW) 等 压 
和信 堆栈。 当前 指令 指针 指 癌 的 是 下 一 条 要 执行 的 指令 ,又 称 为 断 点 ,将 指令 指针 压 人 堆栈 的 
目的 是 为 了 使 在 中 上 断 服 务 程序 执行 完成 后 能 正确 返回 到 当前 于 的 下 一 条 指令 继 


玻 中 断 的 程 月 
续 执 行 。 而 程序 状态 宇 (PSW) 记 录 的 是 当前 指令 执行 完成 后 程序 和 机 顺 的 状态 ,将 PSW 
压 人 堆栈 的 目的 是 为 了 保证 中 断 返 回 后 PSW 能 恢复 成 被 中 断 前 的 状态 。 

(2) 进行 中 断 源 的 识别 。 一 个 机 器 的 中 断 源 和 CPU 的 中 断 请 求 线 往往 不 是 一 一 对 应 
的 , 换 句 话说 ,CPU 的 一 条 中 断 请 求 输入 线 会 对 应 多 个 中 断 源 的 中 断 请 求 输出 。 当 CPU 检 
测 到 一 条 中 断 请 求 信 号 有 效 时 , 它 可 以 判定 外 部 中 断 源 有 了 中 断 请 求 , 但 却 无 法 确定 具体 是 
哪 一 个 中 断 源 发 出 的 请 求 。 因 此 ,在 中 断 啊 应 周期 ,CPU 要 对 发 出 中 断 请 求 的 中 断 源 进 行 
识别 。 男 外 ,在 某 一 时 刻 , 有 可 能 同时 有 两 个 或 两 个 以 上 的 中 断 源 向 CPU 发 出 中 断 请 求 信 
号 ,而 CPU 一 次 只 能 啊 应 一 个 中 断 源 的 请 求 。 在 这 种 情况 下 ,CPU 除了 进行 中 断 源 的 识别 
外 ,还 要 根据 一 定 的 规则 选择 其 中 一 个 进行 啊 应 。 

(3) 形成 中 断 源 中 断 服 务 程序 的 入口 地 址 。 

每 一 个 中 断 源 都 对 应 有 一 段 驻 留 在 内 存 中 的 软件 程序 , 称 为 中 断 服 务 程 序 ,该 程序 的 功 
能 是 完成 中 断 源 需 实现 的 功能 。 例 如 ,打印 机 是 一 个 中 断 源 , 它 所 对 应 的 中 断 服 务 程序 的 功 
能 是 实现 CPU 向 打印 机 传输 数据 。 在 中 断 啊 应 周期 ,识别 中 断 源 后 ,最 后 还 需 形 成 该 中 断 
源 对 应 的 中 断 服务 程序 在 内 存 的 入 口 地 址 , 以便 CPU 从 当前 被 中 断 的 主 程序 转 人 中断 服 
务 程序 执行 ，。 

3) 中 断 源 识别 

中 断 源 识别 的 任务 是 确定 某 次 中 断 啊 应 具体 该 啊 应 的 是 哪个 中 断 源 。 中 断 源 识别 的 方 
法 很 多 ,常用 的 方法 主要 有 软件 查询 法 .硬件 查询 法 和 中 断 问 量 法 等 。 

软件 查询 法 是 通过 执行 一 段 软件 查询 程序 ,对 中 断 请 求 寄 存 器 的 状态 逐 位 判断 ,从 而 确 
定 某 次 该 啊 应 的 是 哪个 中 断 源 。 前 面 讲 到 ,将 各 中 断 源 接口 电路 中 的 中 断 请 求 触发 需 合 在 
起 构成 一 个 中 断 请 求 寄存 器 ,也 就 是 说 ,中 断 请 求 寄 存 器 的 每 一 位 就 对 应 了 一 个 中 断 源 的 
中 断 请 求 状 态 。 将 中 断 请 求 寄存 占 的 内 容 读 出 , 按 某 一 种 顺序 一 位 一 位 进行 判别 , 遇 到 第 一 
个 “1”, 这 一 位 所 对 应 的 中 断 源 就 是 本 次 CPU 识别 啊 应 的 中 断 源 。 

软件 查询 法 的 优点 : 一 是 实现 容易 ,无 须 额外 的 硬件 ; 二 是 控制 灵活 ,查询 顺序 很 容易 
调整 变化 ,这 一 顺序 也 决定 了 优先 啊 应 的 中 断 源 的 顺序 。 其 缺点 是 : 速度 慢 , 只 适合 一 些 对 
中 断 处 理 速 度 要 求 不 是 很 高 的 场合 。 

硬件 查询 法 是 通过 专门 的 便 件 电路 实现 中 断 源 识别 。 一 种 实现 中 断 源 识别 的 串 行 排队 
链 路 如 图 5-14 所 示 。 
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图 5-14 ” 串 行 排队 链 中 断 源 识别 
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在 中 断 响 应 周期 ,CPU 发 出 查询 信号 POL, 沿 着 串 行 排队 链 依 次 经 过 各 中 断 源 接口 。 
当 POL 到 达 某 一 中 断 源 接口 时 ,如 果 该 中 断 源 没 有 中 断 请 求 , 则 将 POL 信号 继续 往 下 传 ; 
如 果 该 中 断 源 有 中 断 请 求 , 则 POL 信号 不 再 往 下 传 ,接口 向 CPU 发 出 回答 信号 SYN, 同 时 
形成 中 断 源 的 中 断 服务 程序 人 口 地 址 ,经 数据 总 线 传送 给 CPU，。 

中 断 问 量 法 是 一 种 通过 硬件 控制 电路 形成 一 个 所 识别 的 中 断 源 的 中 断 问 量 号 ,并 由 此 
中 断 问 量 号 实现 中 断 啊 应 的 方法 。 在 这 种 方法 中 ,每 个 中 断 源 对 应 有 一 个 中 断 问 量 扎 ,中断 
向 量 号 对 应 一 个 中 断 向 量 , 即 中 断 服 务 程序 人 口 地 址 ,将 所 有 中 断 向 量 集中 存放 在 内 存 中 的 
一 片 固 定 区 域 中 。 在 中 断 啊 应 周期 ,首先 由 一 个 专门 的 中 断 控 制 电路 进行 中 断 识 别 ,并 形成 
一 个 对 应 该 中 断 源 的 中 断 向 量 号 ; 然后 将 此 中 断 向 量 号 传送 给 CPU; 最 后 由 CPU 依据 中 
断 间 量 扎 生成 该 中 断 源 的 中 断 问 量 在 内 存 中 的 首 地 址 ,从 这 一 地 址 单元 中 即 可 到 
务 程序 的 和 人口 地 址 ,如 图 5-15 所 示 。 
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图 5-15 ”向量 中 断 示 意图 


x86 CPU 采用 的 承 是 中 断 癌 量 法 ,其 中 断 啊 应 过 程 如 下 : 

中 当 东 一 中 断 源 守 需 要 申请 中 断 时 , 同 中 断 控制 电路 发 出 一 个 请 求 中 断 信号 INTi。 

在 该 中 断 源 的 中 断 请 求 未 被 屏蔽 的 情况 下 ,中 断 控 制 电路 向 CPU 发 出 中 断 请 求 信 
号 INTR 。 

在 CPU 处 于 开 中 断 的 情况 下 ,CPU 啊 应 中 断 , 回 中 断 控制 电路 发 回 一 个 中 二 


啊 应 
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信号 INTA。 

由 中 纶 
给 CPU。 

CPU 依据 此 中 断 向 量 号 计算 得 到 中 断 向 量 地 址 ,并 从 此 地 址 单元 中 取出 该 中 断 源 
对 应 的 中 断 服 务 程序 人 口 地 址 。 

4) 中 上 断 服 务 

CPU 在 中 断 啊 应 周期 获取 到 中 断 服务 程序 人 口 地 址 后 , 便 可 转 人 中 断 服务 程序 执行 。 
一 般 来 讲 ,中断 服务 程序 包括 以 下 几 个 过 程 ( 见 图 5-16) 。 

保护 现场 。 所 谓 现 场 是 指 主 程序 执行 完 当 前 指令 时 的 一 些 寄 
存 器 内 容 等 。 由 于 中 断 服务 程序 在 执行 过 程 中 有 可 能 用 到 主 程序 使 用 
到 的 一 些 寄 存 器 ,因此 必须 在 执行 中 断 服务 程序 前 将 这 些 寄存 器 的 内 开 中 断 
容 保护 起 来 。 保 护 现场 的 具体 方法 就 是 将 CPU 所 有 程序 可 用 的 寄存 
器 内 容 压 人 堆栈 ,以 便 从 中 断 服务 程序 返回 主 程序 时 再 将 这 些 寄存 器 
的 内 容 恢 复 到 中 断 前 的 状态 。 

开 中 断 。 前 面 讲 到 ,CPU 啊 应 中 断 时 执行 了 一 次 硬件 自动 关中 
断 的 操作 ,这 次 关中 断 的 目的 是 阻止 在 保护 现场 的 过 程 中 再 次 视 , 
如 果 本 次 执行 的 中 断 服务 程序 在 后 续 的 中 断 服 务 过 程 中 允许 其 他 的 中 | 
断 , 在 这 里 就 必须 开 中 断 。 开 中 断 的 方法 是 执行 一 条 开 中 断 指令 ,将 
CPU 的 中 断 允 许 触发 器 置 位 。 

中 断 服务 。 其 实 ,中 断 处 理 的 核心 就 是 执行 这 里 的 中 断 服务 ， 下 
服务 的 内 容 就 是 完成 中 断 源 的 功能 。 例 如 ,键盘 作为 计算 机 的 标准 输 程序 
人 设备 , 它 与 CPU 之 间 采 用 的 是 中 断 控制 方式 进行 数据 传输 。 每 当 用 
户 在 键盘 上 按 一 个 键 ,就 会 由 键盘 接口 电路 产生 一 个 中 断 请 求 信 号 发 往 CPU,CPU 啊 应 键 
盘 中 断后 进入 中 断 服务 程 序 。 在 键盘 中 断 服 务 程序 里 的 中 断 服务 主要 实现 对 用 户 所 按键 的 
识别 ,并 根据 所 按键 实现 相应 的 功能 。 

关中 断 。 这 次 的 关中 断 是 在 程序 中 使 用 关中 断 指令 将 CPU 中 的 中 断 允 许 触 发 需 清 
去 ,禁止 一 切 可 屏蔽 中 断 , 使 后 续 的 恢复 现场 工作 不 再 被 新 的 中 断 源 中 断 。 

恢复 现场 。 将 中 断 服务 程序 开始 时 保护 起 来 的 寄存 右 内 容 恢 复 到 中 断 啊 应 
态 , 若 保护 现场 使 用 的 是 人 栈 的 方法 , 则 恢复 现场 应 使 用 相应 的 出 栈 操作 。 

开 中 断 。 再 次 使 用 开 中 断 指令 将 CPU 的 中 断 允 许 触 发 右 置 位 ,以 便 该 中 断 服务 程 
序 执行 完成 后 系统 恢复 到 正常 中 断 工作 状态 。 

中 断 返 回 。CPU 的 指令 系统 通常 会 提供 一 条 中 断 返 回 指令 ,中 断 服务 程序 结束 前 
执行 中 断 返 回 指令 ,执行 该 指令 的 结果 是 将 系统 中 断 啊 应 保护 断 点 时 压 人 栈 的 内 容 出 栈 , 一 
是 恢复 PSW 值 ,二 是 恢复 主 程序 被 中 断 时 的 指令 指针 值 ,从 而 将 程序 控制 返回 到 主 程序 被 
中 断 的 指令 继续 执行 。 


4. 单 级 中 断 和 多 级 中 断 


保护 现场 


前 的 状 


一 个 机 器 系统 中 有 多 个 中 断 源 , 但 CPU 一 次 只 能 响应 和 处 理 一 个 中 断 源 的 中 断 请 求 ， 
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当 某 一 时 间 有 两 个 或 两 个 以 上 的 中 断 源 同时 发 出 中 断 请 求 时 ,中 断 系统 就 必须 从 中 选择 
个 进行 响应 ,选择 的 依据 就 是 各 个 中 断 源 的 中 断 优先 权 。 中 断 系 统 可 以 对 各 中 断 源 依据 其 
发 生 的 中 断 事件 的 重要 性 和 紧迫 性 预先 设 定 中 断 优先 权 , 也 可 以 由 用 户 根据 程序 运行 的 需 
要 灵活 设置 。 

如 果 机 器 系统 的 中 断 源 很 多 ,还 可 以 在 中 断 优先 权 的 基础 上 进一步 分 级 ,高 一 级 的 任何 
一 个 中 断 源 的 优先 权 都 比 低 一 级 的 任何 一 个 中 断 源 的 优先 权 高 ,如 图 5-17 所 示 。 


lly 
ss 


中 断 优 先 机 
图 5-17 中 断 优先 权 和 中 断 优先 级 


如 果 一 个 机 器 系统 只 有 一 个 中 断 级 , 则 称 该 机 玫 的 中 断 系 统 为 单 级 中 断 系统 ; 如 果 一 
个 机 天 系统 有 多 个 中 断 级 , 则 称 该 机 喜 的 中 断 系 统 为 多 级 中 断 系 统 。 

当 CPU 在 执行 一 个 主 程序 时 发 生 了 多 个 中 断 源 的 中 断 请 求 , 中 断 系 统 会 选择 一 个 优 
先 权 高 的 中 断 源 予以 响应 。 那 么 ,如 果 CPU 在 执行 一 个 中 断 服务 程序 时 发 生 了 新 的 中 断 ， 
而 且 新 来 的 中 断 的 优先 权 更 高 ,中断 系 统 该 如 何人 处理 呢 ? 有 两 种 解决 方案 : 一 是 响应 ,二 是 
不 啊 应 ,而 啊 应 与 否 取 决 于 机 器 采用 的 是 单 级 中 断 系统 还 是 多 级 中 断 系 统 。 

单 级 中 断 系 统 采用 的 是 一 种 简单 的 处 理 方 式 : 当 几 个 不 同 优先 权 的 中 断 源 同 时 请 求 中 
断 时 ,系统 按照 它们 优先 权 高 低 先 后 顺序 一 一 啊 应 。 而 当 CPU 正在 处 理 一 个 中 断 时 ,不 再 
啊 应 其 他 新 的 中 断 源 的 中 断 请 求 , 即 使 新 的 中 断 源 的 优先 权 更 高 也 不 子 啊 应 ,只 有 一 个 
中 断 处 理 完 毕 后 再 啊 应 新 的 中 断 请 求 。 多 级 中 断 系 统 则 人 允许 先 处 理 高 优先 级 的 中 断 源 
下 中 断 低 优先 级 的 中 断 服 务 ,这 称 为 多 重 中 断 或 中 断 上 藤 套 。 理 论 上 多 重 中 断 可 以 无 限制 
地 般 套 。 

【 例 5.1】 设 CPU 在 执行 一 个 主 程序 ( 非 中 断 服务 程序 ) 时 ,先是 B 设备 有 了 中 断 请 
求 ,经 过 一 段 时 间 后 又 有 了 A 设备 和 C 设备 的 中 断 请 求 。 

(1) 假设 机 器 系 单 级 中 断 系 统 ,日 A、B.C 设备 的 优先 权 顺 序 由 高 到 低 为 A 一 B 一 C. 

(2) 假设 机 器 系 多 级 中 断 系 统 , 且 A、B.、C 设备 分 属 不 同 的 优先 级 ,它们 的 优先 级 顺序 
由 高 到 低 为 A 一 B 一 C， 

设 CPU 始终 处 于 开 中 断 状态 。 试 通过 图 示 的 方法 说 明 在 单 级 中 断 系 统 和 多 级 中 断 系 
统 中 的 中 断 啊 应 和 处 理 过 程 。 

解 : 

(1) 在 单 级 中 断 系 统 中 ,CPU 首先 啊 应 先 来 的 B 设备 的 中 断 请 求 ,处 理 完 成 后 返回 主 
程序 ; 然后 从 A、C 中 选择 优先 权 更 高 的 A 设备 的 中 断 请 求 子 以 啊 应 ,处理 完 后 再 次 返回 主 


程序 1 最 后 啊 应 (, 充 : 的 中 崭 请 求 ,处 理 完 后 返回 主 程序 , 如 加 5-18(a) 所 示 o 
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(2) 在 多 级 中 断 系 统 中 ,CPU 仍然 首先 啊 应 B 设备 的 中 断 请 求 。 在 也 设备 的 中 断 服务 
过 程 中 又 发 生 了 A、C 中 断 , 由 于 A 设备 的 中 断 优先 级 更 高 ,于 是 再 次 中 断 B 的 中 断 服务 ， 
啊 应 A 中 断 请 求 , 得 A 中 断 处 理 完 后 返回 B 的 中 断 服务 程序 。 由 于 C 中 断 优先 级 比 B 低 ， 
因此 B 中 断 服务 不 再 啊 应 C 中断, 直到 了 中断 处 理 完成 后 返回 到 主 程序 再 啊 应 C 中 上 断 请 
求 , 如 图 5-18(b) 所 示 。 


A 处 理 
B 处 理 
C 处 理 
CPU 
A 请 求 
B 请 求 C 请 求 


(a) 单 级 中 断 啊 应 和 处 理 过 程 


A 处理 
B 处 理 
CC 处理 
CPU 


A 请 求 
B 计 求 、C 请 求 
(b) 多 级 中 断 响应 和 处 理 过 程 


图 5-18 ” 单 级 中 断 和 多 级 中 断 系统 中 断 啊 应 和 处 理 过 程 


从 例 5.1 可 以 看 出 ,中 断 优 先 权 决定 了 各 中 断 源 的 中 断 啊 应 顺 友 ,而 中 断 优 先 级 决定 了 
中 断 处 理 的 顺序 , 先 啊 应 的 中 断 不 一 定 先 处 理 完 。 

在 多 级 中 断 系 统 中 ,利用 中 断 屏 蔽 码 可 以 改变 中 断 源 的 中 断 处 理 顺序 ,使 机 需 的 中 断 系 
统 控制 更 灵活 。 对 于 这 一 点 , 仍 通 过 一 个 例子 加 以 说 明 ， 

【 例 S.2】〗 设 CPU 在 执行 一 个 主 程序 时 ,同时 发 生 了 A、B.C 三 个 设备 的 中 断 请 求 ,A、 
BC 的 中 断 优 先 级 顺序 由 高 到 低 为 A 一 BC。 

(1) 在 ABC 三 个 设备 在 执行 中 断 服 务 程序 时 的 中 断 屏蔽 码 如 表 5-2 所 示 , 其 中 “1” 
表示 屏蔽 “0?” 表 示 开 放 , 试 通过 图 示 的 方法 说 明 对 A、B、C 三 个 设备 的 中 断 啊 应 和 处 理 
过 程 。 


设备 名 称 


CPU 


(2) 大 A、B.C 三 个 设备 在 执行 中 断 服 务 程序 时 的 中 断 屏 项 码 如 表 5-3 所 示 , 试 通过 图 
示 的 方法 说 明 对 ABC 三 个 设备 的 中 断 啊 应 和 处 理 过 程 。 
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表 5-3 屏 菩 码 设置 情况 2 


设备 名 称 


CPU 


解 : 以 上 (1)、(2) 两 种 情况 下 的 中 断 啊 应 和 中 断 处 理 顺 序 分 别 如 图 5-19 所 示 。 


A 处 理 
B 处 理 
CC 处 理 
CPU . 
A、B、C 请 求 
(a) 表 $-2 上 的 中 断 啊 应 和 中 断 处 理 有 顺序 


A 处 理 
B 处 理 
C 处 理 
CPU 
入 、B、KC 请 求 
(b) 私 5-3 的 中 断 啊 应 和 中 断 处 理 须 序 


图 5-19 中断 屏 蔽 码 改变 中 断 处理 顺 序 


从 例 5. 2 可 以 看 出 ,通过 改变 中 断 屏蔽 码 可 以 改变 中 断 源 的 中 断 处 理 顺 序 ,中 断 优先 级 
低 的 中 断 源 可 以 比 中 断 优先 级 高 的 中 断 源 先 处 理 完成 。 


在 CPU 与 设备 之 间 采 用 中 断 控制 方式 进行 传输 的 中 断 接口 电路 中 ,主要 包含 数据 组 
冲 寄存 右 (DBR) .地 址 译 码 电路 .中断 请 求 触 发 句 (IR) .中断 屏蔽 触发 需 (IM) 、 中断 判 优 排 
队 电 路 .中断 癌 量 逻 辑 和 控制 逻辑 等 ,如 岁 5-20 所 示 。 

根据 图 5-20,CPU 控制 设备 进行 一 次 输出 的 过 程 如 下 : 

(1) 首先 CPU 启动 设备 通过 中 断 接 口 的 控制 逻辑 向 设备 发 出 一 个 局 动 控 制 信和 号。 

(2) 当 设 备 准 备 好 时 ,向 接口 发 回 一 个 READY 信号 ,将 接口 中 的 中 断 请 求 触发 器 置 1; 
厂 此 时 设备 处 于 中 断 开 放 状 态 , 即 接口 中 的 中 断 屏 蔽 触发 右 为 1, 则 可 以 通过 控制 逻辑 问 
CPU 发 出 一 个 中 断 请 求 信 号 INTR。 

(3) CPU 接收 到 中 断 请 求 后 , 知 内 部 中 断 允 许 触 发 器 处 于 开 中 断 状 态 , 则 进入 中 断 啊 
应 周期 ,向 接口 发 出 一 个 中 断 响 应 信号 INTA。 在 该 信号 控制 设备 接口 进行 中 断 判 优 和 中 
灯 源 识别 。 
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数据 (3) 


[INTAG | | 中 | 是 向 县 


中 断 接口 


图 5-20 ”中断 接口 电路 


(4) 在 本 设备 被 选中 , 则 将 其 对 应 的 中 断 回 量 号 送 数据 组 冲天 , 并 经 数据 总 线 传 送 给 
CPU ,CPU 依据 此 中 断 癌 量 找 到 中 断 服 务 程序 人 口 地 址 ,从 而 转 人 中 上 断 服 务 程序 执行 。 

(5) 在 中 断 服 务 程序 中 ,CPU 向 设备 传送 一 个 数据 。 
业 方 式 同 设备 传输 一 个 数据 的 过 程 就 完成 了 。 之 后 ,设备 进行 输出 
数据 的 处 理工 作 , 与 此 同时 ,CPU 返回 原 主 程序 继续 执行 。 寿 设备 输出 数据 处 理 完 毕 ,又 通 
过 接口 向 CPU 发 出 一 个 中 断 请 求 信 号 ,进入 下 一 次 中 断 啊 应 和 中 断 处 理 过 程 。 

在 计算 机 中 ,中 断 接 口 电路 可 以 由 专门 的 集成 电路 心 片 实现 。 例 如 ,Intel 8259A 就 是 
一 个 可 编程 的 中 断 控制 器 ,其 内 部 结构 如 图 5-21 所 示 。 它 由 8 个 部 分 组 成 : 8 位 中 断 请求 
寄存 天 IRR、8 位 中 断 屏 蔽 寄存 硕 IMR.、8 位 中 断 服 务 寄存 着 ISR、 优 先 级 判别 硕 、8 位 数据 
总 线 缓冲 需 .中 断 控制 逻辑 .级 联 缓冲 项 /比较 占 和 读 写 逻辑 。 


INTA il INT 


中 断 控制 逻辑 


图 5-21 8259A 中 断 控制 器 


数据 总 线 缓冲 需 通 过 数据 总 线 与 CPU 连接 ,用 于 与 CPU 之 间 的 双 加 数据 交换 ,如 
CPU 向 8259A 传送 控制 字 、 置 中 断 屏 项 字 和 8259A 向 CPU 传送 中 断 向 量 等 。 读 / 写 逻 辑 
用 于 CPU 对 心 片 进行 谈 写 操作 和 内 部 LO 交口 的 地 址 译 码 。 一 个 8259A 通过 其 内 部 的 中 


169 


vd 


170 


MV 
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几 请 求 寄存 硬 可 以 外 接 8 个 中 断 源 的 中 断 请 求 , 通 过 级 联 控制 逻辑 ,可 以 将 9 片 8259A 级 
联 起 来 ,提供 最 多 64 个 外 部 中 断 源 的 中 断 请 求 和 处 理 。 

8259A 的 中 断 处 理 过 程 如 下 : 

(1) 当 外 部 中 断 源 有 了 中 断 请 求 后 ,将 中 断 请 求 寄 存 器 的 对 应 位 置 位 。 

(2) 8259A 接收 这 些 中 断 请 求 , 并 根据 中 断 屏 蔽 寄存 带 的 状态 将 未 被 上 
请 求 送 优先 级 判别 各 进行 判 优 。 

(3) 选择 一 个 优先 级 最 高 的 中 断 源 ,经 中 断 控制 逻辑 向 CPU 发 出 中 断 请 求 信 号 INT。 

(4) 在 CPU 处 于 开 中 断 状 态 , 则 啊 应 中 断 , 癌 8259A 发 回 中 断 应 深信 号 INTA ,进入 由 
两 个 总 线 周 期 构成 的 中 断 啊 应 周期 。 

(5) 在 第 一 个 总 线 周 期 ,8259A 把 当前 啊 应 的 最 高 优先 权 中 断 源 所 对 应 的 中 断 服 务 寄 
存 关 的 相应 位 置 位 ,并 将 中 断 请求 寄 和 存 策 相应 位 清 零 。 

(6) 在 第 二 个 总 线 周 期 ,8259A 将 当前 啊 应 的 中 断 源 的 中 断 类 型 号 (中 断 和 问 量 号 ) 通 过 
数据 总 线 送 至 CPU 。 

(7) CPU 依据 此 中 
汤 服 务 程序 执行 。 

8259A 提供 了 4 种 优先 级 选择 方式 : 四 完全 藤 套 方式 ,这 是 一 种 固定 优先 级 方式 , 它 
规定 任何 情况 下 总 是 IR。 的 中 断 源 优先 级 最 高 ,IR; 的 中 断 源 优先 级 最 低 。 四 轮转 优先 
级 方式 ,对 每 个 中 断 源 同等 对 待 , 当 某 个 中 断 源 处 理 完 后 ,把 它 放 到 最 低级 别 的 位 置 上 ， 
这 样 保 证 每 个 中 断 源 都 有 机 会 被 啊 应 。 印 轮转 优先 级 也 方式 ,CPU 可 以 在 任何 时 候 规定 
一 个 中 断 源 为 最 高 优先 级 ,其 他 中 断 源 的 优先 顺序 也 依据 信号 线 顺序 相应 确定 。 由 查询 
方式 : 通过 软件 读 取 中 断 请 求 寄 存 闫 的 状态 ,依据 软件 查询 的 顺序 确定 中 断 源 的 优先 级 
顺序 。 

8259A 提供 了 两 种 屏蔽 方式 : 山 商 单 屏 燕 方式,8 位 屏蔽 字 与 8 位 中 断 请 求 位 一 一 对 
应 ,为 *1” 则 屏蔽 ,为 “~0” 则 开放 。 己 特殊 屏蔽 方式 ,通过 屏蔽 字 的 设置 ,允许 低 优先 权 的 中 
源 的 中 断 请 求 中 断 高 优先 权 的 中 断 源 的 中 断 服 务 。 例 如 ,和 耕 8259A 被 设置 为 完全 嵌 套 优先 
级 方式 和 特殊 屏蔽 方式 , 则 当 屏 蔽 字 设 置 为 11001111 时 ,IR, 和 IR; 上 的 中 断 请 求 除了 可 
以 中 断 低 级 别 IR, 一 IR; 的 中 断 服务 外 ,还 可 以 中 断 高 级 别 IR, 一 IR; 的 中 断 服 务 。 这 也 就 
是 前 面 讲 到 的 通过 对 中 断 屏蔽 字 的 设置 可 以 改变 中 断 处 理 的 顺序 。 

8259A 的 不 同 控制 和 工作 方式 是 通过 编程 来 实现 的 。 


6. Pentium CPU 的 中 断 机 制 


: 蔽 的 所 有 中 断 


i 类 型 号 便 可 获得 该 中 断 源 的 中 断 服务 程序 入 口 地 址 ,从 而 转 入 中 


Pentium CPU 定义 了 两 类 中 断 源 , 即 中 汤 和 异 第 。 

中 断 主 要 是 指 外 部 中 断 , 它 是 由 CPU 的 外 部 硬件 信号 引起 的 ,包括 两 种 情况 : 一 是 可 
屏蔽 中 断 ,CPU 的 INTR 引 脚 上 接收 到 的 中 断 请 求 , 这 类 中 断 的 允许 或 茶 止 受 CPU 的 标志 
寄存 天 中 的 下 位 ( 即 中 断 允许 触发 磊 ) 的 控制 ; 二 是 非 屏 蔽 中 断 , 是 由 CPU 的 NMI 引 脚 接 
收 到 的 中 断 请 求 ,这 类 中 断 不 能 被 禁止 。 

异 利 主要 是 指 异 第 中 断 , 它 是 由 指令 执行 引发 的 ,包括 两 种 情况 : 一 是 执行 异 第 ,CPU 
执行 一 条 指令 过 程 中 出 现 错误 .故障 等 不 正 彰 情况 引发 的 中 断 ;: 二 是 执行 软件 中 断 指令 (如 
竺 软 中 断 指令 ) 产 生 的 异 背 中 断 。 
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Pentium 共 能 提供 256 种 中 断 和 异 弟 。 每 种 中 断 源 分 配 一 个 编号 , 称 为 中 断 癌 量 号 或 
中 断 类 型 号 。 所 有 的 中 断 和 异 第 按 其 中 断 优 先 级 分 为 5 级 ,其 中 异 第 中 断 的 优先 级 高 于 外 
部 中 断 的 优先 级 

Pentium 是 采用 中 断 癌 量 法 进行 中 断 啊 应 的 , 即 首 先 得 到 中 断 和 问 量 号 ,再 通过 中 断 癌 量 
号 找到 中 断 向 量 , 从 而 获取 中 断 服 务 程序 人 口 地 址 。Pentium CPU 取得 中 断 向 量 号 的 方式 
根据 中 断 源 类 型 的 不 同 也 有 所 不 同 。 对 于 软件 中 断 指令 INTn 来 说 ,其 中 的 即 为 中 断 癌 
量 号 ; 对 于 错误 .故障 等 异 稼 来 说 ,系统 根据 异 第 产生 的 条 件 目 动 指定 辐 量 号 ,每 种 异 靖 的 
癌 量 号 是 固定 的 ,如 中 断 癌 量 号 0 对 应 除 0 错误 异常 ,中 断 问 量 号 4 对 应 算术 溢 ! 
等 ; 而 外 部 中 断 的 中 断 癌 量 呈 是 系统 设计 时 在 中 断 控制 部 中 预先 设 定 的 , 当 啊 应 中 断 时 由 
中 断 控制 硕 提 供 ; 非 屏 蔽 中 断 的 中 断 辣 量 号 固定 为 2。 

所 有 中 断 服 务 程序 人 口 地 址 信息 均 存 于 一 个 中 断 癌 量 号 检索 表 中 ,在 Pentium 实 
下 ,该 表 为 中 断 向 量 表 IVT ,保护 模 式 下 为 中 断 描述 符 表 IDT 。 
实 模式 : 中 断 问 量 表 IVT 位 于 内 存 地 址 0 开始 的 1KB 空间 。 实 模式 是 16 位 寻 址 ,中 
断 服务 子 程序 和 人口 地 址 ( 段 , 偏 移 ) 的 段 寄 存 右 和 段 内 偏 移 量 各 为 16 位 。 它 们 直接 登记 在 
IVT 表 中 ,每 个 中 断 癌 量 号 对 应 一 个 中 断 服务 程序 入 口 地 址 。 每 个 入口 地 址 占 4 字 节 。 
256 个 中 断 问 量 号 共 占 1KB。CPU 取得 癌 量 号 后 目 动 乘 以 4, 作 为 访问 IVT 的 偏 移 , 读 取 
IVT 相应 表 项 ,将 段 地 址 和 偏 移 量 设置 到 CS 和 IP 寄存 器 ,从 而 进入 相应 的 中 断 服务 程序 。 
实 模式 下 中 上 断 啊 应 过 程 如 图 5-22(a) 所 示 。 


中 断 向 量 号 
段 基地 址 


IVT 
x d 00000 | 
四 


让 门 俩 格 


黄 式 


[DT GDILDI 
IDIR 


中 断 服 


务 程 厅 


(b) 休 护 模式 
5-22 ”Pentium CPU 中 断 啊 应 过 程 


保护 模 陈 : 保护 模式 为 32 位 寻 址 。 中 断 摘 述 符 表 IDT 每 一 表 项 对 应 一 个 中 断 问 量 号 ， 
表 项 称 为 中 断 门 描述 符 、 陷 阱 门 换 述 全。 这 些 门 描 述 符 为 8 字 市 长 , 共 对 应 256 个 中 断 癌 量 
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号 ,IDT 表 长 为 2KB。 由 中 断 描 述 符 表 寄存 器 IDTR 来 指示 IDT 的 内 存 地 址 。 以 中 断 疝 量 
号 乘 以 8 作为 访问 IDT 的 偶 移 , 谈 取 相应 的 中 断 门 /陷阱 门 摘 述 符 表 项 。 门 摘 述 符 给 出 中 
断 服 务 程 序 人 口 地 址 ( 段 , 偶 移 ) ,其 中 32 位 偏 移 量 儿 入 EIP 寄存 着 ,16 位 的 段 值 区 人 CS 寄 
存货 。 由 于 此 段 值 是 选择 符 , 还 必须 访问 全 局 描述 特 表 (GDT) 或 局 部 描述 符 表 (LDT), 才 
得 到 段 的 基地 址 。 保 护 模式 下 中 断 啊 应 过 程 如 图 5-22(b) 所 示 。 

进入 中 断 服务 程序 后 ,其 处 理 过 程 如 下 : 

(1) 当中 断 处 理 的 CPU 控制 权 转 移 涉 及 特权 级 改变 时 ,必须 把 当前 的 SS 和 ESP 两 个 
寄存 器 的 内 容 压 人 系统 堆栈 予以 保存 。 

(2) 标志 寄存 器 EFLAGS 的 内 容 也 压 人 堆栈 。 

(3) 清除 标志 触发 需 TF 和 IF。 

(4) 当前 的 代码 段 寄 存 器 CS 和 指令 指针 EIP 也 压 人 此 堆栈 。 

(5) 如 果 中 断 发 生 并 伴随 有 错误 码 , 则 错误 码 也 压 人 此 堆栈 。 

(6) 完成 上 述 中 断 现 场 保护 后 ,从 中 断 问 量 号 获取 的 中 断 服务 程 序 入 口 地 址 ( 段 , 偏 移 ) 
分 别 装 人 CS 和 EIP, 开 始 执 行 中 断 服务 子 程序 。 

(7) 中 断 服 务 于 程序 最 后 的 IRET 指令 使 中 断 返 回 。 保 存在 堆栈 中 的 中 断 现 场 信息 被 
恢复 ,并 由 中 断 点 继续 执行 原 程 序 。 


5.2.3 DMA 控 制 方式 


虽然 中 断 控 制 方式 很 好 地 解决 了 CPU 与 设备 间 并 行 工作 的 问题 ,尤其 是 对 于 慢 速 设 
备 来 说 ,采用 中 断 控 制 方式 进行 数据 传输 ,可 以 大 大 提高 CPU 的 利用 率 。 但 是 ,在 中 断 控 
制 方式 下 ,CPU 每 经 历 一 次 中 断 , 都 要 进行 从 中 断 请 求 信 号 的 建立 .中断 源 识 别 .中断 啊 应 
到 中 断 服 务 等 的 操作 ,在 中 断 服 务 程 序 里 还 要 执行 一 系列 的 诸如 保护 现场 /恢复 现场 . 开 中 
断 / 关 中 断 等 的 指令 ,这 些 操作 和 指令 的 执行 花费 了 不 少时 间 。 对 于 CPU 与 一 些 高 速 设备 
间 采 用 成 组 数据 交换 的 应 用 来 说 ,中 断 控制 方式 就 有 些 显得 力不从心 了 。 为 此 ,人 们 提出 了 
一 种 DMA 传送 控制 方式 。 


1. DMA 的 基本 概念 


DMA 的 全 称 是 Direct Memory Access, 即 再 接 存储 善 访问 ,这 是 一 种 完全 由 硬件 ( 称 为 
DMA 控制 融 ) 控 制 主机 与 设备 间 进 行 数据 交换 的 输入 输出 传送 控制 方式 , 它 通 过 在 主 存 与 
设备 间 建 立 一 条 直接 通道 的 方法 ,来 进一步 提高 IO 数据 传输 效率 。 

在 机 器 中 ,依据 各 部 件 所 处 的 地 位 将 它们 划分 为 两 大 类 : 一 类 是 主 设备 ,一 类 是 从 设 
备 。 主 设备 是 指 能 够 占用 系统 总 线 并 通过 总 线 对 其 他 从 设备 进行 控制 的 设备 ,一 般 来 讲 , 主 
设备 能 够 在 总 线 上 给 出 地 址 和 控制 等 信号 ,完成 对 存储 器 和 外 围 设备 等 的 访问 ,如 CPU 就 
是 机 器 系统 中 的 主 设备 。 而 从 设备 是 指 被 主 设备 控制 和 访问 的 设备 ,如 存储 器 及 各 种 外 围 
设备 等 。 前 面 讲 到 的 程序 控制 方式 和 中 断 控制 方式 ,都 是 在 CPU 这 一 主 设备 的 控制 下 完 
成 存储 器 与 外 围 设备 间 的 数据 交换 的 。 

为 实现 DMA 传送 ,机 器 系统 专门 设置 了 一 个 主 设备 一 一 DMA 控制 器 ,由 DMA 控制 
大 代替 CPU 控制 完成 存储 器 与 外 围 设 备 间 的 数据 交换 ,DMA 控制 项 可 以 像 CPU 一 样 , 通 
过 总 线 癌 存储 兹 和 外 围 设备 给 出 地 址 和 控制 信号 ,实现 对 这 些 设备 的 访问 和 控制 。 
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表 5-4 给 出 了 DMA 与 程序 控制 方式 及 中 断 控 制 方式 的 比较 。 
表 5-4 几 种 输入 输出 控制 方式 的 比较 
输入 输出 控制 方式 输入 输出 过 程控 制 数据 传输 通道 ”CPU 效率 适用 场合 
程序 控制 方式 软件 实现 经 CPU 低 单 用 户 单 道 程 序 环境 
中 断 控制 方式 软 、 硬 件 结 合 实现 经 CPU 一 般 多 用 户 多 道 程序 环境 下 慢 
速 或 速度 不 确定 的 设备 
DMA 控制 方式 硬件 实现 不 经 CPU 成 组 ,高速 设备 


2. DMA 的 工作 模式 


任何 时 候 , 机 器 的 系统 总 线 只 能 被 一 个 主 设备 所 占用 。 当 CPU 在 执行 程序 时 ,需要 通 
过 总 线 进行 访 存 操作 ,如 取 指 令 、 读 / 写 数据 等 ,而 DMA 控制 器 在 进行 DMA 传输 控制 时 也 
要 使 用 总 线 对 存储 器 进行 读 写 操作 等 . 书本 全 ) 上 总 线 的 冲突 。 为 此 需要 一 种 机 制 来 协 
调 CPU 与 DMA 控制 器 对 总 线 的 使 用 , 通 第 有 以 下 三 种 方式 。 

(1) 突 发 方式 (Burst Mode) 。 

突 发 方式 又 称 块 传送 方式 ,在 这 种 方式 下 , 当 CPU 所 执行 的 程序 要 对 一 个 DMA 设备 
进行 一 块 数据 的 读 / 写 操作 时 ,CPU 首先 对 DMA 控制 器 进行 初始 化 ,并 发 送 以 下 信息 

山 是 旋 还 是 与 。 

所 读 / 写 的 存储 髓 缓冲 区 的 首 地 址 。 

所 读 / 写 的 DMA 设备 的 地 址 。 

4) 所 读 / 写 的 字数 。 

然后 ,CPU 暂停 对 部 分 总 线 的 控制 ,将 总 线 控制 权 交 给 DMA 控制 着 ,由 DMA 控制 前 
控制 完成 本 次 数据 块 的 传送 。 当 DMA 传送 结束 时 ,DMA 控制 器 向 CPU 发 出 一 个 中 断 请 
求 信 号 ,并 将 电线 控制 权重 新 交 回 给 CPU 。 

这 种 方式 的 优点 是 控制 简单 ,适用 于 数据 传输 率 很 高 的 IO 设备 实现 成 组 数据 的 传 
送 。 缺点 是 DMA 控制 器 在 占用 总 线 进 行 DMA 传送 时 ,CPU 基本 上 处 于 不 工作 状态 或 保 
持原 定 程度 上 影响 到 CPU 的 利用 率 。 

(2) 周期 挪用 方式 (Cycle Stealing) 。 

周期 挪用 方式 是 一 种 第 用 的 DMA 工作 模式 。 这 种 方式 是 CPU 对 DMA 控制 需 完 成 
一 次 数据 块 传送 的 初始 化 后 继续 工作 , 当 DMA 设备 次 备 好 一 个 数据 的 传送 时 , 回 DMA 控 
制 般 发 出 DMA 请 求 ,DMA 控制 器 收 到 请 求 后 加 CPU 申请 占用 总 线 , 并 在 CPU 啊 应 后 拥 
用 告 干 个 总 线 周 期 进行 一 个 数据 的 传送 ,然后 将 总 线 控制 权 交 还 给 CPU。 如 此 重复 ,直到 
完成 一 个 数据 块 的 传送 。 

与 前 一 种 方式 相 比 ,CPU 不 需要 暂停 ,而 只 是 在 有 了 DMA 请 求 时 暂时 让 出 若干 个 总 
线 的 控制 权 。 而 且 , 如 果 在 DMA 控制 器 使 用 总 线 的 这 些 周 期 里 ,CPU 正好 不 需要 使 用 总 
线 ( 如 使 用 总 线 访 存 等 ) , 则 不 影响 CPU 的 执行 ,从 而 提高 了 CPU 的 利用 率 。 这 种 方式 的 
缺点 是 DMA 控制 需 每 控制 传送 一 个 数据 都 要 向 CPU 申请 占用 总 线 和 交 回 总 线 , 在 一 定 程 
度 上 影响 到 DMA 传送 的 效率 。 
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(3) 透明 方式 (Transparent Mode)，。 

透明 方式 又 称 为 直接 存储 器 访问 方式 。CPU 典型 的 指令 周期 包含 若干 个 总 线 周 期 (又 
称 CPU 周期 ) ,如 取 指 令 周 期 .指令 译 码 周期 . 取 操 作 数 周 期 和 指令 执行 周期 等 。 在 整个 指 
令 周 期 里 CPU 并 不 是 始终 需要 进行 总 线 操作 的 ,如 乘法 指令 的 执行 周期 只 涉及 CPU 内 部 
的 乘法 运 鼻 ,而且 时 间 也 较 长 。 因 此 ,可 以 利用 CPU 不 进行 总 线 操作 的 一 些 总 线 周 期 进行 
DMA 传送 ,这 样 CPU 和 DMA 控制 需 可 以 交替 使 用 总 线 , 而 且 总 线 使 用 的 交 蔡 可 以 通过 不 
同 的 总 线 周期 直接 分 配 ,无 须 CPU 和 DMA 控制 器 之 间 的 请 求 、 建 立 和 归还 过 程 。 例 如 ,将 
每 个 指令 的 指令 译 人 码 周期 固定 分 配给 DMA 传输 之 用 , 当 某 个 指令 译 人 码 周 期 有 DMA 请 求 
时 ,直接 进入 DMA 操作 。 这 就 是 透明 方式 的 基本 思想 。 这 种 方式 对 CPU 和 DMA 来 说 效 
识 和 都 是 最 高 的 ,但 决定 CPU 何 时 不 使 用 总 线 的 硬件 设计 十 分 复杂 ,而且 随 看 CPU 指令 预 
取 ,指令 流水 等 并 行 技术 的 应 用 ,现代 大 多 数 CPU 每 个 周期 都 使 用 总 线 , 因 此 这 种 方式 通 
第 不 被 采用 。 

为 提高 DMA 传输 效率 ,还 可 以 对 总 线 的 配置 进行 设计 。 如 图 5-23(a) 所 示 是 一 种 传统 
的 单 总 线 系统 ,在 这 种 系统 中 ,DMA 控制 器 和 CPU ,存储 器 .IO 接口 及 设备 一 起 连接 在 一 
条 单 总 线 上 。DMA 控制 闫 每 控制 一 个 数据 的 传输 部 至 少 要 占用 两 个 CPU 周期 ,一 个 用 于 
对 设备 的 读 或 写 , 男 一 个 用 于 对 存储 器 的 读 或 写 , 这 两 个 CPU 周期 都 需要 占用 总 线 。 

图 5-23(b) 是 一 种 在 传统 的 单 总 线 基础 上 增加 一 条 专用 I/O 总 线 的 结构 ,在 这 种 系统 
里 ,DMA 控制 器 对 存储 器 的 访问 需要 与 CPU 共享 系统 总 线 , 而 对 DMA 设备 的 访问 则 通过 
1/O 总 线 进行 ,这 样 可 以 减少 在 DMA 传输 过 程 中 因 DMA 控制 融 过 多 占用 系统 总 线 而 对 
CPU 产生 的 影响 。 


图 5-23 ”DMA 控制 的 总 线 配 置 


3. DMA 控制 器 的 组 成 及 工作 原理 


图 5-24 给 出 了 一 个 DMA 控制 右 的 内 部 结构 及 与 CPU 等 部 件 相 联 的 组 成 框架 图 。 其 
中 ,从 DMA 的 内 部 结构 看 , 它 主要 包含 以 下 部 件 : 

(1) 地 址 寄存 各 。 用 于 存放 所 交换 的 数据 块 在 主 存 的 痛 地 址 。 在 DMA 传送 前 ,由 
DMA 初始 化 程序 将 数据 块 在 主 存 中 的 首 地 址 送 到 该 地 址 寄存 器 。 在 DMA 传送 过 程 中 ,每 
交换 一 次 数据 ,地 址 寄存 项 自动 增 1, 以 指 加 下 一 内 存单 元 ,直到 一 批 数 据 传送 完毕 为 止 。 

(2) 字 计 数 寄 人 存 关 。 用 于 记录 所 传送 数据 的 总 字数 。 在 DMA 传送 前 ,同样 由 DMA 
始 化 程序 将 所 传送 数据 的 总 字数 送 到 该 寄存 器 。 在 DMA 传送 过 程 中 ,每 传送 一 个 字 , 字 计 
数 妖 日 动 减 1, 直 到 减 为 0, 表示 该 批 数据 传送 完毕 ,于 是 通过 中 断 控 制 逻 辑 向 CPU 发 出 
DMA 中 断 请 求 信 和 号。 

(3) 数据 缓冲 寄存 各 。 用 于 暂 存 每 次 传送 的 数据 。 通 第 DMA 控制 各 与 主 存 之 间 米 用 
字 传 送 ,而 与 设备 之 间 可 能 是 字 节 或 位 传送 。 因 此 DMA 控制 器 中 还 可 能 包括 装配 或 拆 缉 
字 信 息 的 硬件 逻辑 ,如 数据 移 位 缓 冲 寄存 送 、 字 市 计数 天 等 。 

(4) DMA 控制 逻辑 。 它 用 于 负责 管理 DMA 的 传送 过 程 , 包 括 接收 设备 的 DMA 请 求 
和 加 CPU 申请 总 线 的 占用 及 归还 等 
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(5) 中 断 控制 逻辑 。 在 字 计 数 固 计 为 0 时 ,表示 一 批 数 据 交 换 完 毕 ,由 中 断 控制 逻辑 加 
CPU 发 出 中 断 请 求 ,请求 CPU 进行 DMA 操作 的 后 处 理 。 

(6) 读 写 控制 逻 辑 。 用 于 DMA 控制 项 对 存储 肯 和 设备 进行 读 或 写 操 作 的 控制 ,其 功 
能 与 CPU 的 读 写 控制 相同 。 

(7) 控制 字 寄 存货 。 一 些 可 编程 的 DMA 控制 需 是 以 集成 芯片 的 形式 提供 的 ,通常 它 
们 具有 多 种 工作 模式 或 操作 方式 ,在 使 用 前 可 通过 软件 编程 的 方法 对 其 进行 初始 化 设置 。 

结合 图 5-24, 可 以 给 出 DMA 传输 控制 的 过 程 如 下 : 

(1) 在 DMA 数据 传输 前 ,首先 由 CPU 通过 初始 化 程序 对 DMA 控制 器 进行 预 设置 , 包 
括 将 所 传输 数据 块 在 内 存 的 首 地 址 送 DMA 内 部 的 地 址 寄存 器 ,将 所 传输 数据 的 字数 送 
DMA 内 部 的 字 计 数 寄存 占 等 。 

(2) DMA 控制 冀 选 择 一 个 DMA 设 人 各 
设备 来 说 就 是 准备 好 了 一 个 剖 
一 个 DMA 请 求 依 号 DREQ。 

(3) DMA 控制 器 接收 到 设备 请 求 后 ,加 CPU 发 出 HOLD 信号 ,申请 占用 总 线 。 

(4) CPU 通过 HLDA 信号 进行 总 线 啊 应 ,同时 将 其 引出 脚 的 地 址 .数据 和 部 分 控制 线 
置 为 浮 空 状态 ,即将 总 线 的 控制 权 让 出 。 

(5) DMA 控制 硕 获 得 总 线 控制 权 后 , 回 设备 回答 一 个 DMA 啊 应 信号 DACK, 并 开始 
局 动 一 次 数据 的 传输 。 

(6) DMA 控制 器 将 其 地 址 寄存 器 的 内 容 输出 到 地 址 总 线 上 ,并 给 出 读 / 写 控制 信和 号 , 控 
制 设 备 与 存储 带 之 间 的 一 次 数据 交换 ,然后 地 址 寄存 希 增 1, 字 计数 寄存 融 减 1。 

(7) 重复 以 上 过 程 , 直 到 字 计 数 寄存 天 减 为 和 过,DMA 控制 着 加 CPU 发 出 中 断 请 求 , 同 
时 结束 DMA 传输 ,将 总 线 控制 权 归 还 CPU。 

(8) CPU 啊 应 DMA 中 断 请 求 ,并 进行 DMA 传输 的 后 处 理 操作 。 

从 上 述 DMA 传输 控制 过 程 可 以 看 出 ,存储 希 与 设备 的 数据 交换 没有 经 过 CPU ,完全 
是 在 DMA 控制 句 的 控制 下 完成 的 ,地 址 寄存 融 的 增 1 操作 、 字 计数 需 的 减 1 操作 等 都 是 由 
便 件 目 动 完成 的 ,每 传输 一 个 数据 也 无 须 像 中 断 方式 那样 经 


-开始 工作 。 当 被 选中 的 设备 准备 就 绪 时 (对 输入 
据 , 对 输出 设备 来 说 驶 是 准备 好 接收 ), 癌 DMA 控制 大 发 出 
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图 5-24 DMA 控制 器 的 组 成 
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因此 传输 效率 大 大 提高 了 。 
5.2.4 通道 控制 方式 
1. 1/O 通道 的 概念 


在 前 面 介 绍 的 几 种 输入 输出 传输 控制 方法 中 ,程序 控制 方式 全 部 依赖 CPU 进行 ,中 断 
方式 要 求 CPU 的 不 断 介 入 ,这 两 种 方式 主要 适合 于 对 速度 要 求 不 高 的 设备 ; 在 DMA 控制 
方式 中 ,CPU 无 须 干预 数据 传输 的 过 程 , 而 只 需 进 行 传 输 前 的 初始 化 和 传输 后 的 后 处 理 , 由 
于 传输 控制 是 硬件 文 持 ,所 以 适用 于 高 速 的 数据 输入 和 输出。 以 上 几 种 控制 方式 广汉 应 用 于 
微型 和 小 型 计算 机 系统 中 。 但 在 大 型 计算 机 系统 中 ,由 于 外 围 设 备 配 置 多 ,输入 输出 操作 频 
,因此 对 输入 输出 传输 方式 有 了 更 高 的 要 求 ,主要 体现 在 以 下 两 个 方面 : 

(1) 尽量 减少 对 CPU 资源 的 占用 ,使 用 独立 的 控制 部 件 完成 输入 输出 的 操作 。 

(2) 控制 更 加 灵活 ,输入 输出 控制 部 件 能 适应 不 同性 能 的 设备 的 要 求 。 

为 此 ,在 DMA 方式 的 基础 上 进一步 发 展 了 1/O 通道 方式 ,以 满足 大 型 计算 机 系统 对 输 
和 输出 控制 的 要 求 。 

1/O 通道 (LO Channel) 又 称 通道 处 理 茧 ,是 一 种 能 执行 有 限 指令 集 的 专用 处 理 表 , 它 
通过 执行 存储 在 内 存 中 的 固定 或 由 CPU 设置 的 通道 程序 来 控制 设备 的 输入 输出 操作 。 与 
DMA 控制 器 一 样 ,通道 也 是 一 个 独立 的 控制 部 件 , 但 它 比 DMA 控制 禹 更 进 了 一 步 。 一 方 
面 它 是 一 个 处 理 硕 ,具有 有 限 的 指令 集 , 能 够 执行 程序 ; 男 一 方面 它 控制 灵活 ,可 以 适应 不 
同 工 作 方式 .不 同 速度 要 求 和 不 同 数据 格式 的 不 同 种 类 的 设备 的 要 求 。 当 然 , 通 道 处 理 顺 还 
不 是 一 个 通用 处 理 需 ,而 是 专用 于 输入 输出 控制 的 IO 处 理 亏 。 

通道 处 理 器 可 以 分 担 CPU 大 部 分 的 IO 处 理工 作 , 如 管理 所 有 低速 外 围 设备 的 输入 
输出 操作 ,对 DMA 控制 副 的 初始 化 工作 ,控制 DMA 的 数据 传输 、 数 据 格式 转换 设备 状态 
检测 等 ,使 CPU 能 从 烦琐 的 W/O 处 理 中 解脱 出 来 ,真正 发 挥 其 "计算 ”的 能 力 。 


2. 1/O 通道 的 功能 


一 个 具有 通道 功能 的 典型 机 需 机 构 如 图 5-25 所 示 。 

一 般 来 讲 , 通 道 主 要 包括 寄存 善 部 分 和 控制 部 分 。 寄 存 如 部 分 包括 数据 缓冲 寄存 需 、 主 
人 存 地 址 寄存 带 、. 字 计数 寄存 天 .通道 谷 令 字 寄 存 厦 .通道 状态 寄存 种 等 ; 控制 部 分 包括 分 时 
控制 .地 址 分 配 数据 传输 .数据 装配 和 拆 熏 等 控制 逻辑 。 

使 用 通道 方式 组 织 的 输入 输出 系统 ,一般 及 用 "主机 -通关 -设备 控制 着 -IO 设备 ”四 级 

连接 方式 。 通 遂 对 IO 设备 的 控制 通过 设备 控制 硕 或 IO 接口 进行 。 对 于 不 同 的 IO 设 

备 ,设备 控 制 细 的 结构 和 功能 各 有 不 同 , 但 通道 与 设备 控制 右 之 间 一 般 采 用 标准 I/O 接口 
相连 接 。 通 道 执行 指令 产生 的 控制 命令 经 设备 控制 各 的 解释 转换 成 对 设备 操作 的 控制 , 设 
备 控制 各 还 能 将 设备 的 状态 反映 给 通道 和 CPU，。 

具体 来 说 ,通道 一 般 具 有 以 下 几 方 面 的 功能 : 

(1) 接收 来 自 CPU 的 W/O 指令 ,根据 指令 要 求 选择 设备 。 

(2) 执行 CPU 为 通道 组 织 的 通道 程序 ,这 包括 从 主 存 中 取出 通道 指令 ,对 通道 指令 进 
行 详 人 码 ,并 根据 指令 的 要 求 加 设备 控制 项 发 出 各 种 命令 。 
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图 5-25 ”通道 控制 结构 


据 字数 控制 ,根据 需要 


(3) 控制 设备 与 主 存 之 加 的 数据 传输 ,提供 主 存 地 址 和 传送 的 数 

(4) 检查 设备 的 工作 状态 ,并 将 完整 的 设备 状态 信息 送 往 主 存 或 指定 单元 保存 。 

(5) 同 CPU 发 出 输入 输出 操作 中 断 请 求 ,将 外 围 设 备 的 中 断 请 求 和 通 所 本 身 的 中 断 请 

设 控制 人 大 的 具体 任务 包括 : 

(1) 从 通关 接受 通 站 命令 ,控制 设备 完成 指定 的 操作 。 

(2) 回 通 道 提 供 设 备 的 状态 

(3) 将 各 种 设备 的 不 同 信号 转换 成 通道 能 够 识别 的 标准 信和 号 。 

CPU 通过 执行 1/O 指令 以 及 处 理 来 自 通道 的 中 断 ,实现 对 通道 的 管理 。 来 目 通 道 的 中 
上 晰 有 两 种 : 一 种 是 数据 传输 结束 中 断 ; 态 一 种 是 故障 中 断 。 通 道 的 管理 一 般 是 由 操作 系统 
实现 的 。 


. |/ 〇 通 追 的 种 类 


按 通 性 的 数据 传输 及 工作 方式 划分 , 通 己 可 分 成 字 广 多 路 通 志 、 选 择 通 道 和 数组 多 路 通 
道 三 种 类 型 。 一 个 机 兹 系统 可 以 碰 有 三 种 通 扎 ,也 可 以 只 包含 其 中 一 种 或 两 种 ,以 适应 不 同 
种 类 设备 的 需要 。 

(1) 罕 方 多 踏 通 志 (Byte Multiplexer Channel) 。 

字 广 多 路 通道 用 于 连接 多 个 慢 速 或 中 速 的 设备 ,这 些 设 备 的 数据 传送 以 字 太 为 单位 ，。 
一 般 来 讲 , 这 些 设备 每 传送 一 个 字 市 需要 较 长 的 等 待 时 间 , 因 此 ,通道 可 以 以 字 市 为 单位 轮 
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流 为 多 个 设备 服务 ,以 提 融 通 己 的 利用 率 。 和 从 市 多 路 通 忆 的 操作 模式 有 两 种 : 字 忆 交叉 模 
式 和 狮 发 模式 。 在 字 市 交 义 模式 中 , 通 站 将 时 间 分 为 一 个 个 时 间 段 ,有 数据 传输 要 求 的 每 一 
个 设备 都 可 以 轮流 分 配 得 到 一 个 时 间 段 ,完成 一 次 与 通道 间 的 数据 交换 。 如 果 某 一 设备 需 
要 传输 的 数据 量 比较 大 , 则 通道 可 以 采用 独 发 的 工作 模式 为 其 服务 。 在 独 发 模式 下 ,通道 与 
设备 之 间 的 传输 一 直 维 持 到 设备 请 求 的 传输 完成 为 止 。 通 道 使 用 一 种 超时 机 制 判 断 设备 的 
操作 时 间 ( 即 逻辑 连接 时 间 ) ,并 决定 采用 哪 一 种 模式 。 如 采 设 备 请 求 的 逻辑 连接 时 间 大 于 
某 个 额定 的 值 ,通道 就 转换 成 狸 发 模式 ,否则 就 以 字 节 交叉 模式 工作 

(2) 选择 通道 (Selector Channel) 。 

对 于 局 速 的 设备 ,如 磁盘 等 ,要 求 较 高 的 数据 传输 速度 。 对 于 这 种 高 速 传输 , 通 息 难以 
同时 对 多 个 这 样 的 设备 进行 操作 ,只 能 一 次 对 一 个 设备 进行 操作 ,这 种 通 近 称 为 选择 通道 。 
设备 请 求 的 传输 完成 为 止 , 然 后 为 其 他 外 围 设备 传 
输 数 据 。 选 择 通 道 的 数据 宽度 是 可 变 的 ,通道 中 包含 一 个 保存 输入 输出 数据 传输 所 需 的 参 
数 寄存 全 。 参 数 寄存 各 包 括 存 放下 一 个 主 存 传输 数据 存放 位 置 的 地 址 和 对 传输 数据 计数 的 
寄存 器 。 选 择 通道 的 输入 输出 操作 启动 之 后 ,该 通道 就 专门 用 于 该 设备 的 数据 传输 直到 操 

(3) 数组 多 路 通道 (Block Multiplexer Channel) 。 

数组 多 路 通道 以 数组 (数据 块 ) 为 单位 在 奋 干 局 速 传 输 操 作 之 加 进 行 交 义 复 用 ,这 样 可 
减少 外 围 设 备 申 请 使 用 通 壹 时 的 等 得 时 间 。 数 组 多 路 通 追 适用 于 高 速 外 围 设 备 ,这 些 设备 
的 数据 传输 以 块 为 单位 。 通 道 用 块 交 叉 的 方法 ,轮流 为 多 个 外 设 服 务 。 当 同时 为 多 人 台 外 围 
设备 传送 数据 时 ,每 传送 完 一 块 数据 后 选择 下 一 个 外 围 设备 进行 数据 传送 ,使 多 路 传输 并 行 
进行 。 数 组 多 路 通道 既 保 留 了 选择 通 所 局 速 传输 的 优点 ,又 能 同时 为 多 个 设备 提供 服务 ,使 
通道 的 功能 得 到 有 效 发 挥 , 因 此 数组 多 路 通道 在 实际 系统 中 得 到 较 多 的 应 用 。 特 别 是 对 于 
仙 盘 和 磁 市 等 一 些 块 设备 ,它们 的 数据 传输 本 来 承 是 按 块 进 行 的 。 而 在 传输 操作 之 前 又 需 
要 寻找 记录 的 位 置 ,在 寻找 期 间 让 通道 等 待 是 不 合理 的 。 数 组 多 路 通 中 可 以 驳回 一 个 设备 
发 出 一 个 寻找 的 命令 ,然后 在 这 个 设备 寻找 期 间 为 其 他 设备 服务 。 在 设备 寻找 完成 后 才 牙 
正 建 立 数 据 连 接 ,并 一 下 维持 到 数据 传输 完毕 。 因 此 采用 数组 多 路 通 所 可 提高 通道 的 数据 
传输 的 吞吐 量 。 

字 节 多 路 通道 和 数组 多 路 通道 都 是 多 路 通道 ,在 一 段 时 间 内 可 以 交 蔡 地 执行 多 个 设备 
的 通道 程 厅 ,使 这 些 设 备 同时 工作 。 但 两 者 也 有 区 别 , 首 先 数 组 多 路 通 起 允许 多 个 设备 同时 
工作 ,但 只 人 允许 一 个 设备 进行 传输 型 操作 ,而 其 他 设备 进行 控制 型 操作 ; 而 字 广 多 路 通道 不 
仅 允 许多 个 设备 同时 操作 ,而 且 人 允许 它们 同时 进行 传输 型 操作 。 其 次 ,数组 多 路 通 直 与 设备 
之 间 的 数据 传送 的 基本 单位 是 数据 块 , 通 道 必 须 为 一 个 设备 传送 完 一 个 数据 块 以 后 才能 为 
别 的 设备 传送 数据 块 ; 而 字 节 多 路 通道 与 设备 之 间 的 数据 传送 的 基本 单位 是 字 节 ,通道 为 
一 个 设备 传送 一 个 字 节 之 后 ,又 可 以 为 另 一 个 设备 传送 一 个 字 节 ,因此 各 设备 与 通道 之 间 的 
数据 传送 是 以 字 市 为 单位 交 蔡 进行 的 。 


4. 1/ 通过 的 工作 过 程 


在 使 用 了 通道 的 机 此 里 ,CPU 有 两 种 工作 状态 : 一 是 目 态 ,二 是 管 态 。 目 态 是 指 CPU 
执行 用 户 的 目标 程 订 ,而 浓 态 十指 CPU 执行 管理 程序 。 通 追 传 输 过 程 是 由 用 户 程 序 执行 
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一 条 广 到 坊 管 指令 -| 起 的 ,其 输入 输出 过 过 程 如 图 — ”0 所 未 局 
目标 程序 


通 考 程序 


心 区 芭 SEY 


通道 处 理 器 


通道 完成 一 次 数据 传输 的 主要 过 程 分 为 以 下 4 个 步骤 : 

(1) 用 户 程序 使 用 访 管 指令 进入 管理 程序 。 

(2) CPU 根据 用 户 的 访 管 指 令 组 织 形成 一 个 通道 程序 ,并 启动 通道 。 

(3) 通道 处 理 带 执行 CPU 为 它 组 织 的 通道 程序 ,控制 完成 指定 的 数据 输入 输出 传输 


(4) 通道 在 执行 完 通 道 程序 后 向 CPU 发 出 中 断 请 求 。 
CPU 执行 用 户 程 序 和 管理 程序 以 及 通道 执行 通道 程序 的 时 间 关 系 如 图 5-27 所 示 。 


访 管 指令 
CPU 日 大， 用户 程 序 用 户 程序 用 户 程序 


CPU 管 态 


通道 处 理 睾 


由 于 大 多 数 计算 机 的 W/O 指令 都 属于 管 态 指令 ,因此 ,用 户 通过 在 目标 程序 中 设置 一 
条 要 求 进行 输入 输出 的 广义 访 管 指 令 来 使 用 设备 。 广 义 指 令 由 访 管 
它 的 操作 码 实 际 上 就 是 对 应 此 广义 指令 的 管理 程序 人 口 。 访 管 指令 是 目 态 指令 , 当 目 标 程 
序 执行 到 要 求 输入 输出 的 访 管 指令 时 ,产生 一 个 目 愿 访 管 中 断 。CPU Nad oe 
管理 程序 人 口 ,进入 管 态 。 

PO 中 广义 指令 提供 的 参数 ,如 设备 号 、 交 换 数 据 长 度 和 数据 在 主 存 
起 始 地 址 等 信息 来 编制 形成 一 段 通道 程序 。 通 道 程序 由 辱 干 条 通道 指令 组 成 ,能 够 完 

一 条 IO 指令 所 要 求 的 操作 。 通 道 程序 编制 好 后 , 放 在 主 存 中 与 这 个 通道 相对 应 
i 道 程 序 缓冲 区 中 。 男 外 ,在 管理 程序 中 还 要 把 通道 程序 的 人 口 地 址 放 和 人 相应 的 通道 地 
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址 单元 。 在 管理 程序 的 最 后 ,用 一 条 局 动 J 设备 的 指令 来 局 动 通 近 开 始 工 作 。 

接 下 来 ,通道 处 理 器 开始 执行 CPU 为 它 组 织 的 通道 程序 ,完成 指定 人 出 传输 工 
作 。 此 时 ,CPU 也 返回 用 户 程序 继续 执行 ,通道 处 理 入 和 CPU 并 行 工作 。 当 通道 处 理 融 执 
行 完 通道 程序 后 ,执行 一 条 上 断 开 通 所 指令 ,加 CPU 发 出 中 断 请 求 ,CPU 吧 应 中 上 断 并 进行 相 
应 的 后 处 理 。 

至 此 ,一 次 由 通道 控制 的 主 存 与 设备 间 的 数据 交换 绪 


5. 通 站 结构 的 发 展 


结构 的 进一步 发 展 ,出现 了 两 种 计算 机 1/O 体系 结构 : 

(1) 给 入 输出 处 理 占 OP IOP 是 通道 结构 的 IO 处 理 融 , 它 可 以 和 CPU 并 行 工 
作 ,提供 高 速 的 DMA 处 理 能 力 , 实 现 数 据 的 高 速 传送 。 但 是 它 不 是 独立 于 CPU 工作 的 ,而 
是 主机 的 一 个 部 件 。 有 些 IOP, 如 Intel 8089 IOP ,还 提供 数据 的 变换 搜索 以 及 字 装 配 / 拆 
他 能 力 。 这 类 IOP 广泛 应 用 于 中 小 型 及 微型 计算 机 中 。 

(2) 外 围 处 理 机 (PPU) 。PPU 基本 上 是 独立 于 主机 工作 的 , 它 有 自己 的 指令 系 乡 
成 算术 /逻辑 运算 . 庶 / 写 主 存储 天 .与 外 围 设 备 交 换 信 息 等 。 有 的 外 围 处 理 机 直接 就 选用 曼 
有 的 通用 计算 机 。 外 围 处 理 机 方式 一 般 应 用 于 大 型 计算 机 系统 中 ,用 于 处 理 大 量 而 蚂 淋 的 
输入 输出 操作 ,以 使 CPU 能 从 输入 输出 控制 操作 中 最 大 限度 地 解脱 出 来 ,专用 于 “计算 ?的 
处 理 。 
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在 第 4 和 章 讲 到 ,存储 毅 按 在 计算 机 中 所 起 的 作用 分 为 两 大 类 , 即 内 存 和 外 存 。 内 存 又 称 
为 主 存 ,主要 由 半导体 存储 器 件 构 成 ,其 特点 是 速度 快 ; 而 外 存 又 称 为 辅 存 , 从 现代 存储 介 
质 的 发 展 看 ,主要 由 磁 介 质 存 储 枯 和 光盘 存储 融 构 成 ,其 特点 是 容量 大 ,价格 低廉 。 在 计算 
机 中 ,外 存 是 作为 设备 来 进行 管理 的 。5. 3 节 主 要 讲述 构成 计算 机 外 存 的 磁 介 质 存储 器 和 
光盘 存储 章 。 


5.3.1 磁盘 存储 希 

效 盘 是 在 一 定 的 基质 上 涂 上 一 层 磁性 材料 而 构成 的 圆 盘 , 在 磁盘 表面 利用 磁 存 储 原 理 
来 存储 信息 。 磁 盘 分 为 硬盘 和 软盘 两 种 。 硬 盘 和 软盘 因 它 们 的 基质 分 别 使 用 了 * 硬 ”的 金属 
合金 和 “ 软 ” 的 聚 酯 薄膜 而 得 名 。 硬 盘 和 软盘 在 构成 上 以 及 容量 和 访问 速度 上 有 所 不 同 ,但 
从 信息 的 存储 原理 来 讲 , 它 们 是 完全 相同 的 。 


1. 磁 记 录 诛 理 和 旋 与 方式 


| 


磁盘 是 依靠 由 一 个 个 同心 圆 组 成 的 磁道 上 的 具有 不 同 磁 化 方 回 的 磁化 元 来 存储 0、1 信 
恩 的 。 对 这 些 磁化 元 的 读 写 是 通过 一 个 磁头 来 进行 的 。 们 头 是 由 磁性 材料 制作 而 成 的 , 形 
状 如 同一 个 矩形 环 ,靠近 磁道 方 同 上 开 有 一 个 小 间 隐 ,在 磁头 上 还 分 别 比 有 一 组 写 线 圈 和 读 
线圈 。 磁 头 在 对 一 个 磁道 进行 读 写 操作 时 ,磁头 固定 不 动 , 而 磁道 运动 ,如 图 5-28 所 示 。 
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写 线圈 


图 5-28 ”磁盘 读 写 原理 


进行 写 操作 时 ,在 写 线圈 中 通过 一 定 方 回 的 脉冲 电流 时 ,磁铁 心 内 就 产生 一 定 方 问 的 磁 
通 , 并 在 磁头 间 隐 处 产生 很 蝇 的 磁场 。 在 这 个 磁场 作用 下 ,位 于 磁头 下 的 磁道 上 的 荣 个 固定 
单元 就 被 磁化 成 相应 极 性 的 磁化 元 。 每 个 磁化 元 记录 一 位 二 进 制 位 , 当 和 磁盘 相对 于 磁头 运 
动 时 ,就 可 以 连续 写 人 一 连 串 的 二 进 制 信息 。 

进行 谈 操 作 时 ,经 过 磁头 的 磁化 元 会 使 磁铁 必 内 产生 磁 通 的 变化 ,从 而 使 谈 线 圈 中 产生 
一 定 的 感应 电势 ,经 于 换 变 成 一 定 方 同 的 脉冲 电流 ,由 此 脉冲 电流 即 可 判定 所 恋 出 的 是 0 还 
是 1。 

传统 的 磁盘 是 将 读 和 瑟 操 作 共 用 一 个 磁头 完成 ,而 新 一 代 的 人 刹 盘 系统 则 来 用 了 不 同 的 
谈 写 机 制 , 它 将 旋 写 操作 分 别 在 两 个 不 同 的 磁头 上 完成 , 写 机 制 与 传统 方式 相同 ,而 谈 机 制 
则 有 所 不 同 。 读 磁头 是 由 一 个 磁 阻 (Magneto Resistive, MR) 式 感应 冀 组 成 的 , MR 的 电阻 
大 小 取决 于 在 它 下 面 运 动 的 介质 的 磁化 方 各 。 让 电流 通过 MR 感应 囊 , 此 时 电阻 的 变化 作 
为 电压 信号 被 检测 出 来 ,从 而 检测 出 读 出 的 是 0 还 是 1。 及 用 这 种 新 的 读 机 制 , 允 许 有 更 融 
的 读 操 作 频 度 , 从 而 使 磁盘 可 以 达到 更 高 的 存储 密度 和 读 操 作 速 度 。 


2. 人 磁盘 存储 兹 的 物理 构成 


矿 盘 存储 峰 主 要 由 磁盘 片 .位 盘 驱动 器 和 磁盘 
的 ,而 硬盘 则 由 多 个 盘 片 构成 ,通常 称 为 盘 片 组 。 

磁盘 驱动 上 般 由 机 械 和 电 天 两 大 部 分 组 成 。 硬 磁盘 中 , 盘 片 组 固定 安装 在 一 个 主轴 上 , 主 
轴 通 过 传动 市 与 一 个 主 电机 相连 。 人 硬盘 组 的 每 一 个 盘面 上 都 有 一 个 独立 的 磁头 ,磁头 通 六 
磁头 臂 连接 在 一 个 固定 滑 轨 上 运动 的 小 车 上 ,再 通过 小 车 与 一 个 定位 驱动 装置 相连 ,如 
图 5-29 所 示 。 


位 盘存 储 咒 的 物理 组 成 


磁盘 驱动 器 的 机 械 部 分 一 方面 驱动 盘 片 组 按 一 定 转速 绕 主 旬 


转动, 另 一 方面 驱动 小 车 
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通过 磁头 臂 市 动 磁头 沿 径 回 运动 ,进行 磁道 的 定位 。 目 前 磁头 小 车 的 驱动 方式 有 来 用 步 进 电 
机 或 音 圈 电机 两 种 。 步 进 电机 靠 脉冲 信号 驱动 ,控制 和 宙 单 ,整个 驱动 定位 系统 是 开 环 控制 
的 ,因此 定位 精度 较 低 ,一 般 用 于 着 密度 不 高 的 便 人 磁盘 驱动 硕 。 而 音 圈 电机 是 线性 电机 ,可 
以 直接 驱动 磁头 作 和 直线 运动 ,驱动 定位 系统 是 一 个 市 有 速度 和 位 置信 息 反 馈 的 闭环 控制 系 
统 ,驱动 速度 快 ,定位 精度 高 ,因此 被 更 多 的 便 磁 盘 驱 动 各 有 了 所 米 用 。 
效 鼻 驱动 硕 的 电 北 部 分 主要 是 由 一 些 控制 电路 组 成 的 ,其 功能 主要 包括 主 电 机 和 和 定位 
电机 的 控制 ,磁头 的 选择 和 读 写 控制 ,磁盘 索引 的 识别 和 届 区 的 定位 等 。 

倒 盘 控制 郑 是 主机 与 磁盘 驱动 肯 之 间 的 接口 。 磁 盘存 储 表 是 高 速 外 存 设 备 , 它 与 主机 
之 间 采 用 成 组 数据 交换 方式 。 作 为 主机 与 驱动 器 之 间 的 控制 希 , 磁 盘 控制 项 有 两 个 接口 : 
一 个 是 与 主机 的 接口 ,控制 磁盘 与 主机 之 间 通 过 外 部 总 线 交 换 数 据 ; 兄 一 个 是 与 磁盘 驱动 
售 的 接口 ,根据 主机 命令 控制 磁盘 驱动 硕 的 操作 。 夯 外 ,磁盘 控制 大 还 能 完成 磁盘 与 主机 之 
间 的 数据 格式 转换 以 及 数据 的 编码 和 解码 工作 。 


注 盘 是 以 “盘面 | 磁道 | 悄 区 ”的 方式 来 进行 数据 组 织 的 。 磁 盘 的 盘面 由 一 个 个 同心 同 
环 组 成 ,每 一 个 圆 环 称 为 一 个 磁道 。 当 对 磁盘 进行 读 写 时 ,磁头 定位 在 磁道 上 ,为 防止 或 减 
少 由 于 磁头 定位 不 准确 或 磁 域 间 的 干扰 所 引起 的 错误 , 相 邻 磁道 间 有 一 定 的 间隙 。 一 般 来 
讲 ,一 个 磁盘 面 有 上 和 王 个 硫 


北道 。 
磁道 又 进一步 被 分 割 成 几 十 到 上 百 个 等 长 的 圆 缴 ,每 一 段 圆 弧 称 有 
区 可 以 存储 奉 干 位 信息 , 它 也 是 磁盘 与 主机 之 间 交 换 信 息 的 基本 单位 ， MRI 
盘 的 读 写 操作 _- 次 至 少 是 一 个 届 区 。 一 个 而 区 所 存储 二 进 制 位 数 的 大 小 由 操作 系统 对 磁盘 
进行 格式 化 时 确定 ,大 多 数 系统 所 定义 的 扇 区 的 大 小 为 512B 一 2KB。 相 邻 扇 区 间 同 样 留 有 
一 定 的 间 际 。 磁 盘 的 数据 组 织 形式 如 图 5-30 所 示 。 


图 5-30 ”磁盘 的 数据 组 织 分 布 图 


当 记 圈 磁道 经 过 磁头 的 速率 要 比 外 图 慢 。 因 此 ,需要 寻找 一 种 方式 来 补偿 

束 率 的 变化 ， 使 磁头 能 以 同样 的 速 诗 谈 写 所 有 的 磁道 种 有 效 的 办 法 是 通过 增 大 信息 位 
站 际 来 实现 。 这 样 以 恒定 角 onstan Angular Velocity, CAV) 转 动 的 盘 , 能 使 磁头 
以 相同 的 速率 来 扫描 了 所 有 信息 位 。 图 5-30 就 是 一 种 采用 CAYV 技术 的 磁盘 布局 格式 , 它 的 
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好 处 是 ,能 方便 地 以 磁道 号 和 朵 区 号 来 直接 寻 址 各 个 数据 块 。 为 将 磁头 从 当前 位 置 移 到 指 
定位 置 ,只 需 将 磁头 径 同 移动 到 指定 磁道 ,然后 等 竺 指定 扇 区 转 到 磁头 下 即 可 。CAV 的 缺 
点 是 ,外 圈 的 长 磁道 上 存储 的 数据 位 数 与 内 圈 的 短 磁 道 相 同 ,浪费 了 长 磁道 的 存储 空间 。 
一 个 磁道 的 存储 容量 是 与 磁道 的 长 度 ( 周 长 ) 有 关 的 。 在 上 述 CAV 方式 中 ,为 使 所 有 

磁道 的 容量 相同 ,从 外 圈 磁 道 到 内 圈 磁 道 的 线性 密度 是 逐渐 增 大 的 ,磁盘 的 容量 也 就 受到 最 
内 圈 人 磁道 所 能 达到 的 最 大 记录 密度 的 限制 。 为 提高 存储 容量 ,现代 磁盘 系统 使 用 一 种 称 为 
多 区 式 记 录 (Multi Zone Recording ,MZR) 的 技术 。 它 将 磁盘 盘面 划分 成 几 个 区 (典型 的 是 
16 区 ) ,每 个 区 中 的 所 有 磁道 的 面 区 数 是 相同 的 ,从 而 磁道 的 容量 也 是 相同 的 ; 但 不 同 区 的 
磁道 所 拥有 的 扇 区 数 是 不 同 的 ,从 而 容量 也 就 不 同 , 越 往 内 圈 的 区 ,磁道 容量 越 小 。 当 磁头 
由 一 个 区 移动 到 另 一 个 区 时 ,容量 的 改变 会 引起 磁头 上 读 写 时 序 的 变化 ,也 就 使 磁盘 控制 电 
路 的 控制 更 为 复杂 ,但 这 种 电路 的 复杂 所 带 来 的 是 磁盘 容量 的 提升 。 

为 使 磁头 能 对 届 区 进行 准确 定位 ,磁道 上 会 有 一 个 起 怒 点 , 称 为 磁盘 宗 引 ,同时 每 个 原 

起 点 和 终点 的 标识 。 磁 盘 经 格式 化 后 ,相关 控制 信息 被 记录 在 磁盘 上 ,并 由 磁盘 驱动 

器 所 识别 和 使 用 

磁盘 格式 化 的 例子 如 图 5-31 所 示 。 在 此 例 中 ,每 个 磁道 包含 30 个 固定 长 度 悄 区 ,每 个 
局 区 有 600B, 其 中 512B 为 有 效 效 据 ,剩余 的 为 磁盘 控制 天 使 用 的 控制 信息 。 其 中 各 欣 制 信 
县 的 含义 如 下 。 

(1) ID 域 : 是 唯一 的 一 个 标识 或 地 址 ,用 于 定位 具体 局 区 。 

(2) 同步 字 节 : 是 一 个 特殊 的 位 序列 ,用 来 定义 区 域 的 起 始点 。 

(3) 人 磁道 号 : 用 来 标识 磁盘 上 的 一 个 磁道 。 

(4) 磁头 号 : 用 来 标识 磁盘 组 中 的 一 个 磁头 。 

(5) 出 区 号 : 用 来 标识 磁道 上 的 一 个 面 区 。 


(6) CRC: 循环 元 余 校 验 码 。 
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600 子 /局 区 


区 盘存 储 需 的 主要 性 能 指标 包括 存储 密度 .存储 容量 和 访问 时 间 等 。 
1) 存储 密度 
磁盘 表面 的 存储 密度 主要 分 为 道 密 度 和 位 密度 。 道 密度 是 指 沿 磁 纸 径 回 单位 长 度 上 的 
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磁道 数 ,单位 为 道 /英寸 (TPD 或 道 /毫米 (TPM)。 位 密度 是 指 磁道 单位 长 度 上 能 记录 的 二 
进 制 代码 位 数 ,单位 为 位 /英寸 COBPI) 或 位 / 室 米 (BPM) 。 
2) 存储 容量 
一 个 磁盘 存储 髓 所 能 存储 的 字 节 总 数 , 称 为 磁盘 存储 器 的 存储 容量 。 存 储 容 量 有 格式 
化 容量 和 非 格 式 化 容量 之 分 。 格 式 化 容量 是 指 按照 某 种 特定 的 记录 格式 所 能 存储 信息 的 总 
量 ,也 就 是 用 户 可 以 真正 使 用 的 容量 。 非 格式 化 容量 是 磁 记 录 表 面 可 以 利用 的 磁化 单元 
总 数 。 将 磁盘 存储 器 用 于 某 计算 机 系统 中 ,必须 首先 进行 格式 化 操作 ,然后 才能 供用 户 
记录 信息 。 从 图 5-31 可 以 看 出 ,经 格式 化 后 的 磁盘 的 每 个 恒 区 内 部 和 扇 区 之 间 都 留 有 间 
际 及 控制 和 校 验 信 息 , 因 此 ,格式 化 容量 比 非 格式 化 容量 小 ,一 般 为 非 格式 化 容量 的 60 如 一 
70%。 
在 所 有 磁道 容量 相同 的 磁盘 存储 器 中 ,格式 化 容量 可 以 按 下 述 方法 计算 : 
磁盘 存储 器 总 容量 王 盘 面 数 X 每 面容 量 
面容 量 王 磁道 数 X 每 道 容 量 
道 容 量 王 扇 区 数 X 每 扇 区 容量 
而 非 格式 化 容量 则 可 以 按 下 述 方法 计算 : 
磁盘 存储 器 总 容量 一 盘面 数 X 每 面容 量 
面容 量 二 磁道 数 X 每 道 容量 
磁道 数 王 道 密度 X 径 向 有 效 距 离 
道 容量 二 位 密度 X 磁 己 周 长 


3) 访问 时 间 

磁盘 存储 器 的 访问 时 间 主 要 由 寻 道 时 间 .旋转 延 时 和 传送 时 间 三 部 分 组 成 。 

当 磁 盘 驱 动 需 操作 时 ,磁盘 主轴 电机 融 动 盘 片 以 恒定 的 速度 转动 。 为 了 读 或 写 ,磁头 必 
须 精 确定 位 在 所 含 数据 的 磁道 和 扇 区 的 起 始 处 。 磁 道 选 择 包 括 在 可 移动 磁头 系统 中 移动 磁 
头 或 在 固定 磁头 系统 选择 某 个 人 磁头。 在 可 移动 磁头 系统 中 ,磁头 定位 到 该 磁道 所 花 的 时 间 
称 为 寻 道 时 间 。 无 论 哪 一 种 磁头 系统 ,一 旦 磁道 选 定 , 磁 盘 控 制 右 将 处 于 等 待 状态 ,直到 相 
关 届 区 旋转 到 磁头 可 读 写 的 位 置 ,这 段 时 间 称 为 旋转 延 时 。 寻 起 时 间 和 旋转 延 时 的 总 和 称 
为 存 取 时 间 , 即 定位 到 读 写 位 置 的 时 间 。 从 所 访问 的 扇 区 头 开 始 , 整 个 扇 区 从 磁头 下 经 过 ， 
即 完 成 了 该 扇 区 的 数据 传送 ,这 部 分 时 间 称 为 传送 时 间 。 

寻 道 时 间 : 由 于 寻 道 时 间 是 不 确定 的 ,因此 一 个 磁盘 存储 器 的 寻 道 时 间 一 般 取 平均 寻 
道 时 间 。 平 均 寻 站 时 间 是 最 大 寻 道 时 间 与 最 小 寻 道 时 间 的 平均 但, 目前 硬盘 的 平均 寻 道 时 
间 通 常 在 5ms 到 10ms 之 间 , 而 SCSI 硬盘 则 应 小 于 或 等 于 8ms。 

旋转 延 时 : 每 次 对 一 个 磁道 上 某 个 局 区 的 访问 ,旋转 延 时 也 是 不 同 的 ,因此 旋转 延 时 也 
取 平 均值 ,现在 一 般 在 3ms 到 6ms 之 间 。 平 均 放 转 延 时 和 磁盘 转速 有 关 , 它 用 磁盘 旋转 一 
周 所 需 时 间 的 一 半 来 表示 。 转 速 为 7200r/min 的 磁盘 其 平均 旋转 时 间 为 4. 17ms。 

传送 时 间 : 磁盘 的 数据 传送 时 间 ,除了 与 所 传送 的 数据 大 小 有 关外 ,主要 取决 于 磁盘 的 
数据 传输 率 。 磁 盘存 储 器 在 单位 时 间 内 癌 主机 传送 数据 的 字 节 数 , 称 为 数据 传输 率 , 数 据 传 
输 率 与 存储 设备 和 主机 接口 逻辑 有 关 。 从 主机 接口 逻辑 考虑 ,应 有 足够 快 的 传送 速度 向 设 
备 接 收 /发 送信 息 。 从 存储 设备 考虑 ,磁盘 转速 越 快 , 数 据 传 输 率 也 就 越 高 。 假 设 磁盘 旋转 
速度 为 每 秒 r 转 , 每 条 磁道 容量 为 N 个 字 节 , 则 数据 传输 率 为 
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D = rN(B/s) 
若 要 传送 的 数据 为 5。 字 节 , 则 传送 时 间 为 
p 


Ty 


于 是 ,磁盘 存储 器 总 的 平均 访问 时 间 T, 可 表示 成 
有 
人 27 | 7N 
其 中 TT. 为 平均 寻 道 时 间 。 
表 5-5 给 出 了 当今 典型 的 磁盘 存储 器 的 性 能 参数 。 
表 5-5 ”典型 的 磁盘 存储 器 性 能 参数 


Seagate Seagate Toshiba Toshiba Hitachi 

和 Barracuda 180 CheetahXlS-36LP DTOIACAO0S0S0  HDD1242 Microdrive 
应 用 大 容量 服务 器 ”高 性 能 服务 天 果 面 系统 便携 式 手持 设备 
容量 /GB 181. 6 36. 7 500 5 4 
最 小 寻 道 时 间 / ms 0. 8 0. 3 0. 6 和 1 
平均 寻 道 时 间 /ms 7.4 3.6 15.5 15 12 
转速 / (r/min) 7200 15 000 7200 4200 3600 
平均 旋转 延 时 /ms 4. 17 2 4. 17 7. 14 8. 33 
最 大 传输 率 /(MB/s) 160 522 一 709 140 66 7.2 
每 扇 区 字 节 数 512 512 4096 512 512 
每 道 悄 区 数 793 485 一 63 一 
盘面 数 24 8 2 
柱 面 数 ( 每 盘面 磁道 数 ) 24 247 18 851 一 10 350 一 


【 例 5.3】 设 革 磁盘 组 有 6 片 磁盘 ,每 片 有 两 个 记录 面 , 最 上 最 下 两 个 面 不 用 。 存 储 区 域 
内 疾 直 径 为 20mm, 外 圈 直 径 为 80mm, 关 密度 为 20 道 / 训 米 ,最 内 圈 磁 拓 位 密度 为 1 000 位 / 守 
米 , 问 : 


扇 区 的 容量 为 512B, 则 该 磁盘 格 


(2 ) 若 该 右 盘 经 格式 化 后 。 每 个 磁道 首 有 12 个 扇 区 ,每 
式 化 容量 为 多 少 字 市 ? 
解 : 
(1) 每 个 盘面 的 磁道 数 二 20X (80 一 20)/2 二 600( 道 ) 
每 道 的 容量 二 3. 14X20X1000 一 62 800( 位 ) 
义 组 总 存储 容量 二 盘面 数 XX 磁 道 数 XX 道 容量 二 10 X 600 X62 800/8= 二 47(GB) 
(2) 磁盘 格式 化 容量 三 盘面 数 关 磁道 数 x 每 道 记 区 数 关 每 面 区 容量 
一 10X600X12X512 一 36.8(GB) 
【 例 $S.4】 设 一 个 转速 为 15 000 转 / 分 (RPM) 的 磁盘 ,其 平均 寻 道 时 间 为 4ms, 每 磁道 500 
司 区 ,每 届 区 512B。 现 欲 从 该 磁盘 上 读 取 一 个 由 2500 个 刷 区 组 成 的 总 长 为 1. 28MB 的 文件 。 
(1) 假设 该 文件 随机 分 布 在 磁盘 的 不 同 扇 区 中 , 试 计 算 读 取 该 文件 所 需 的 总 访问 时 间 。 
(2) 寿 该 文件 所 占 忆 区 分 布 在 同一 个 柱 面 的 5 个 磁 站 上 , 试 计 算 谈 取 该 文件 所 需 的 总 
坊 回 时 间 。 
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MA 


解 : 
(1) 根据 磁盘 转速 可 以 计算 得 到 平均 旋转 延 时 为 2ms, 对 每 个 届 区 而 言 ， 
访问 时 间 二 平均 寻 道 时 间 十 平均 旋转 延 时 十 传送 时 间 
一 4ms 十 2ms 十 4/500ms 
一 0. 008ms 
则 读 取 该 文件 所 需 的 总 访问 时 间 计 算 如 下 ， 
总 访问 时 间 王 2500X6.008ms 王 15.02s 
(2) 由 于 2500 个 诛 区 正好 占用 了 5 个 磁道 , 且 这 5 个 磁道 又 位 于 同一 柱 面 上 ,因此 寻 
道 只 需 一 次 ,时 间 为 pp hove henan 下 
总 访问 时 间 二 4ms 十 5 X 读 取 一 个 磁道 的 时 间 
一 4ms 十 5X(2ms 十 4ms) 
一 0U.Uods 


知识 拓展 
硬盘 接口 

主机 与 硬盘 存储 器 的 连接 是 通过 硬盘 接口 进行 的 。 计 算 机 中 的 硬盘 接口 主要 包括 IDE 
接口 .SCSI、 光 纤 通 道 和 USB 接口 等 。 

现代 PC 的 主板 上 主要 集成 的 是 IDE 接口 ( 见 图 5-32)。IDE 是 Integrated Device 
Electronics 的 简称 ,又 被 称 为 ATA(Advanced Technology Attachment)。 这 两 个 名 词 都 有 
厂商 在 使 用 , 指 的 是 相同 的 东西 。IDE 之 后 又 推出 了 EIDE, 即 扩展 的 IDE (Enhanced 
IDE) ,而 这 个 接口 标准 同时 又 被 称 为 Fast ATA。 所 不 同 的 是 Fast ATA 是 专 指 硬盘 接口 ， 
而 EIDE 还 制定 了 连接 光盘 等 产品 的 标准 。 之 后 又 陆续 推出 的 速度 更 快 的 接口 ,名 称 都 留 
有 ATA 的 字样 ,如 Ultra ATA 以 及 传输 速度 分 别 达 到 66MB/s、100MB/s、133MB/s 的 
ATA/66、ATA/100、ATA/133 年。 

以 上 传统 的 ATA 接口 均 采 用 并 行 传输 方式 ,现在 又 出 现 了 束 行 ATA(Serial ATA， 
SATA) ,如 图 5-33 所 示 。 其 最 大 数据 传输 座 更 进一步 提高 到 了 150MB/s, 将 来 还 会 提高 到 
300MB/s。 而 且 其 接口 非常 小 巧 , 排 线 也 很 细 , 有 利于 机 箱 内 部 空气 流动 从 而 加 强 散 热 效 
果 , 也 使 机 箱 内 部 显得 不 太 凌 乱 。 与 并 行 ATA 相 比 ,SATA 还 有 一 大 优点 就 是 支持 硬盘 的 
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5-32 IDE 接口 图 5-33 ” 串 行 ATA 接口 


SCSI 的 英文 全 称 为 Small Computer System Interface( 小 型 计算 机 系统 接口 ), 是 同 
IDE(ATA) 完 全 不 同 的 接口 。SCSI 并 不 是 专门 为 硬盘 设计 的 接口 ,而 是 一 种 广泛 应 用 于 小 
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型 机 上 连接 各 种 具有 SCSI 设备 的 高 速 数 据 传输 接口 。SCSI 具有 多 任务 .带宽 大 、CPU 占 
用 率 低 以 及 热 插 拔 等 优点 。 但 SCSI 硬盘 较 高 的 价格 使 得 它 很 难 在 PC 中 首 及 ,因此 SCSI 
硬盘 主要 应 用 于 中 、 融 端 服务 器 和 融 档 工作 站 中 。 

SCSI 从 诞生 到 现在 已 经 历 了 三 十 多 年 的 发 展 , 先 后 衍生 出 了 SCSI-1、Fast SCSI、 
FAST-WIDE-SCSL2 .Ultra SCSI Ultra2 SCSI、 Ultral160 SCSI、 Ultra320 SCSI 等 ,现在 市 
场 中 占据 主流 的 是 传输 速度 分 别 达 到 160MB/s、320MB/s 的 Ultral160 SCSI Ultra320 SCSI 
接口 产品 。 

光纤 通道 (Fibre Channel) 和 SCSI 一 样 最 初 也 不 是 为 硬盘 设计 开发 的 接口 技术 ,是 专 
门 为 网 络 系 统 设计 的 ,但 随 着 存储 系统 对 速度 的 需求 , 才 逐 渐 应 用 到 硬盘 系统 中 。 光 纤 通 道 
硬盘 是 为 提高 多 硬盘 存储 系统 的 速度 和 灵活 性 才 开 发 的 , 它 的 出 现 大 大 提高 了 多 硬盘 系统 
的 通信 速度 。 光 纤 通 道 的 主要 特性 有 : 热 插 拔 性 、 高速 市 视 .远程 连接 .连接 设备 数量 大 等 。 

光纤 通道 是 为 在 像 服务 器 这 样 的 多 硬盘 系统 环境 而 设计 的 ,能 满足 高 端 工作 站 ,服务 
器 .海量 存储 子 网 络 、 外 设 间 通 过 集线器 /交换 机 和 点 对 点 连接 进行 双向 串 行 数据 通信 等 系 
统 对 高 数据 传输 认 的 要 求 。 

USB 接口 不 是 专 为 硬盘 设计 的 接口 标准 。 目 前 在 PC 上 ,USB 接口 用 途 广 泛 , 如 可 以 
用 于 连接 移动 硬盘 。 有 关 USB 接口 的 内 容 在 第 6 章 详细 讲述 ， 


5.3.2 磁带 存储 器 
磁带 存储 


合 也 属于 一 种 磁 介 质 存储 血 , 与 磁盘 存储 剖 一 样 , 它 也 是 通过 位 记录 原理 来 存 
储 信 息 的 。 但 与 磁盘 不 同 的 是 , 它 是 通过 在 一 条 和 柔韧 的 聚 酯 溥 膜 市 上 涂 上 一 层 磁性 材料 来 记 
录 信 息 的 。 磁 市 卷 在 两 个 可 以 来 回转 动 的 转轴 上 ,并 固定 装 入 一 个 盒 中 ,组 成 盒 式 磁带 。 计 算 
机 所 使 用 的 磁 囊 和 磁带 机 与 家 用 的 磁 市 录音 机 相似 ,也 是 通过 磁 市 在 一 个 固定 磁头 下 的 平行 
移动 来 完成 数据 存 取 的 。 计 算 机 中 所 用 的 磁 市 宽度 从 0. 15in(0. 38cm) 到 0. 5in(1. 27cm)， 
长 度 从 600in(182m) 到 2400in(728m) 不 等 。 

磁 市 上 的 磁道 是 沿 磁 市 运动 方 回 平行 排列 的 。 早 期 磁 市 系统 一 般 使 用 9 个 磁道 ,每 次 
存 取 一 个 字 闻 ,其 中 8 个 磁 送 构成 一 个 有 效 字 站 信息 ,第 9 磁道 上 是 附加 的 奇偶 校 验 位 。 后 
来 的 磁带 系统 使 用 18 或 36 个 磁道 ,这 对 应 于 数字 的 一 个 字 或 双 字 。 这 种 记录 格式 称 为 并 
行 记录 。 人 然而 ,现代 大 多 数 磁带 系统 使 用 串 行 记录 方式 ,数据 作为 一 系列 的 二 进 制 位 串 沿 同 
一 磁道 顺序 存储 ,就 如 同 磁 盘 在 同一 磁道 上 顺序 存储 数据 一 样 。 随 着 技术 的 发 展 ,磁带 上 的 
令 道 数 可 以 达到 几 昌 道 ,这 大 大 提高 了 磁 市 存储 天 的 容量 。 

串 行 记录 位 市 使 用 一 种 被 称 为 蛇 形 记录 (Serpentine Recording) 的 记录 方式 。 按 此 方 
式 ,数据 从 一 个 磁 融 的 头 部 开始 , 沿 一 个 磁道 从 头 到 尾 记 录 ,到 达 磁 市 尾部 时 ,再 沿 另 一 磁道 
从 尾 到 头 记录 ,再 次 回 到 磁带 头 部 时 ,又 沿 第 三 个 磁道 从 头 到 尾 记 录 , 如 此 往复 ,如 图 5-34 
所 示 。 

磁 市 在 数据 组 织 上 也 是 采用 分 块 的 方式 。 图 5-35(a) 和 图 5-35(b) 分 别 是 一 种 采用 并 
行 记录 的 0. 5in 9 道 局 停 式 磁 市 和 采用 串 行 记录 的 0.25in 数据 流 磁 市 的 数据 记录 格式 。 

0.5in 9 道 局 停 式 磁 市 是 一 种 国际 上 通用 的 标准 磁 市 。 每 盘 市 均 设 有 卷 头 标 BOT 和 卷 
尾 标 EOT ,标记 用 一 块 矩 形 金 属 反 光 薄 膜 制 成 ,光电 检测 元 件 可 检测 到 这 两 个 标记 ,表示 记 
录 的 开始 和 结束 。 磁 带 上 留 有 间 际 G(3.75in) 或 g(0. 6in), 后 者 为 数据 块 间 的 间 际 ,它们 取 
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fF 的 蛇 形 记录 方式 


(b) 0.25in 数据 洲 磁 市 数据 记 条 格式 


决 于 磁 市 机 的 快 司 停 性 能 。 

信息 可 用 两 种 形式 存储 ,一 种 是 文件 形式 ,一 盘 市 可 记录 寿 干 个 文件 ,一 个 文件 又 分 
若干 数据 块 (Bi) ,每 个 文件 始末 有 文件 头 标 和 文件 尾 标 , 卷 头 标 、 索 引 、 文 件 头 标 、 文 件 尾 
标 均 为 80B, 其 内 容 视 操作 系统 而 定 。 第 二 种 是 数据 块 形 式 , 磁 带 可 在 数据 块 之 间 启 停 ， 
进行 数据 传输 。 在 9 道 带 中 ,8 位 是 至 据 磁 这 ， 存储 一 个 字 节 , 另 一 位 是 这 一 字 节 的 奇偶 
校 验 位 ,叫做 横 回 奇偶 校 验 码 。 在 每 一 数据 块 Bi 内 部 , 沿 走 带 方 问 每 条 磁道 还 有 CRC 校 
验 位 。 

pe dd 
步 数据 块 标志 (1B) .用 户 数据 (512B) 、 地 验 码 (2B) 和 后 同步 。 

为 提 融 位 市 存储 磊 的 访问 速 度 ,磁头 能 同时 对 几 个 相 邻 磁道 (通常 常 是 2 一 8 个 磁道 ) 进 行 
读 写 操作 。 数 据 仍 是 沿 各 磁道 蛇 形 串 行 记录 ,但 数据 块 不 是 在 同一 磁道 上 顺序 存放 的 ,而 是 
在 相 邻 磁道 依 序 排列 的 。 如 图 5-36 所 示 是 一 个 能 同时 进行 4 个 磁 直 谈 写 的 磁 市 的 块 分 
布 图 。 


sa [1] [5] [更 ] BE [| 
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系统 参数 DLT4000 DLT8000 SDLT600 
容量 /GB 20 40 300 
数据 速率 / (MB/s) 1.5 6 36 
位 密度 /(Kb/cm) 32.3 38.6 92 
磁道 密度 /( 道 /cm) 101 164 587 


磁带 驱动 器 是 一 种 顺序 存 取 设 备 。 若 磁头 当前 定位 于 块 1 ,而 需 读 块 N, 则 它 必 须 依次 
读物 理 块 1 一 N 一 1, 每 次 一 个 块 。 帮 磁头 当前 定位 已 超越 所 需 访 问 的 块 时 , 它 必 须 倒 这 ,从 
前 面 开 始 重 新 问 前 读 。 

磁带 存储 紫 是 一 种 低 价 格 、 慢 速 ,、 大 容量 的 辅助 
备份 。 


5.3.3 光盘 存 依 饥 


光盘 存储 骨 是 一 种 采用 光 存 储 技术 存储 信息 的 存储 器 , 它 采 用 聚焦 激光 束 在 盘 式 介质 
上 非 接 触 地 记录 高 密度 信息 ,以 介质 材料 的 光学 性 质 (如 反射 率 、 偏 振 方向 ) 的 变化 来 表示 所 
存储 信息 的 "17 或 0”。 由 于 光盘 存储 般 容 量 大 、 价 格 低 、 携 带 方便 及 交换 性 好 等 特点 ,已 成 
为 计算 机 中 一 种 重要 的 辅助 存储 各 ,也 是 现代 多 媒体 计算 机 (MPC) 不 可 或 缺 的 存储 设备 。 

光 存 储 技术 源 于 20 世纪 70 年 代 。1972 年 ,Philips 公司 设计 出 世界 上 第 一 个 能 播放 模 
拟 电视 信号 的 光盘 系统 。1978 年 ,世界 上 第 一 台 商 品 化 的 激光 视盘 机 (Laser Vision ,LV ) 
由 Philips 公司 推出 ,其 原理 是 仿效 声音 唱片 的 形式 ,把 图 像 和 伴音 信号 记录 在 圆 盘 上 ,用 激 
光束 检测 盘 上 记录 的 信息 , 准 f 基 和 氏 换 成 电信 号, 经 处 理 后 还 原 成 宽频 和 音 省” dt 国志 多 矶 

显示 图 像 和 发 出 声音。1981 年 , Philips 公司 和 Sony 公司 携手 推出 了 数字 激 》 
(Compact Disc-Digital Audio,CD-DA) ,并 为 此 制定 了 光盘 技术 领域 非常 重要 的 基础 性 技 
术 文 件 一 一 《红皮书 标准 》。 

1985 年 ,Philips 和 Sony 的 人 研究 人 员 在 经 过 几 年 的 努力 后 终于 解决 了 光盘 上 只 能 记录 
数字 音乐 信息 ,而 不 能 记录 计算 机 文件 信息 的 问题 。 具 体 来 说 就 是 解决 如 何在 光盘 上 划分 
地 址 ,以 便 计 算 机 系统 可 以 根据 地 址 编号 随时 存 取 数 据 和 降低 光盘 数据 存 取 误 码 率 问 题 。 
为 此 他 们 和 * 布 了 在 光盘 上 记录 计算 数据 的 《 贰 皮 书 标准 》。。 后 来 国际 标准 化 组 织 (ISO) 又 对 
该 标准 进行 了 和 完善, 发布 『 ISO 9660 标准 。 这 样 ,CD-ROM 便 进入 了 计算 机 ,并 很 快 得 到 
了 广泛 的 应 用 ,CD-ROM 已 成 为 现代 多 媒体 计算 机 中 的 标准 配置 之 一 。 随 后 ,人 研究 人 员 们 
一 方面 努力 提高 CD-ROM 的 读 取 速度 ,由 最 初 的 2 倍速 ,4 倍速 (MPC3 标准 ) 发 展 到 今天 
的 52 倍速 ; 为 一 方面 又 进一步 推出 了 用 于 计算 机 中 可 读 写 的 光盘 和 DVD 等 ,巩固 和 确立 
了 光盘 存储 此 在 计算 机 辅助 存储 问 中 的 重要 地 位 。 


1. 光盘 存储 器 的 分 类 


储 器 ,在 计算 机 系统 中 常用 于 数据 


按 光 盘 可 擦 写 


性 分 类 主要 包括 只 读 型 光盘 和 可 擦 写 
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只 读 型 光盘 所 存储 的 信息 由 光盘 制造 厂家 预先 用 模板 一 次 性 将 信息 写 入 ,以 后 只 能 读 
采用 的 数据 格式 的 不 同 ,又 可 以 将 盘 片 分 


光盘 上 , 它 包 括 CD-R CD-RW 和 相 变 光盘 及 磁 光 盘 等 。 
稼 见 的 光盘 种 类 ,功能 及 相关 标准 如 表 5-7 所 示 。 
表 5-7 常见 光盘 种 类 .功能 及 相关 标准 
出 现时 间 功能 说 明 
| | CD 系列 光盘 的 始祖 ,由 Philips 和 Sony 于 1982 年 
红 度 吓 1982 年 z z z 
由 Philips 和 Sony 联合 制定 ,定义 了 存储 计算 机 数 


大 小 等 ,使 光 存 储 进入 计算 机 领域 
Philips 和 Sony 针对 消费 电子 市 场 推出 的 一 种 交 
数据 存储 格式 ,使 之 能 同步 播放 声音 、 
影像 及 其 他 信息 如 文字 等 

一 次 刻录 型 的 光盘 片 , 不 管 数据 是 否 填 满 盘 片 ,只 
能 写 人 一 次 ,即使 还 剩余 空间 ,也 不 能 再 写 


CD-I 


CD-K 


CD-RW 


Video CD 


DVD 


2. CD-ROM 


标准 禹 片 的 直径 为 120mm;, 中 心 装 卡 孔径 为 15mm, 厚 度 为 大 
14 一 18g, 其 基质 由 树脂 (如 聚 碳酸 酯 ) 制 成 ,数据 信息 以 一 系列 微 凹 坑 的 样式 刻录 在 光盘 表 
面 上 。CD-ROM 光盘 在 制作 时 ,首先 用 精密 聚焦 的 高 强度 激光 束 制 造 一 个 母 盘 ,然后 以 母 
盘 作 为 模板 压 印 出 聚 碳酸 酯 的 复制 品 , 再 在 止 坑 表 面 上 镀 一 层 高 反射 材料 ( 铝 或 金 ) ,最 后 在 


外 层 上 涂 一 层 内 烯 酸 树脂 以 防 灰 全 或 划 伤 ,如 图 5-37 所 示 。 


丙烯酸 树脂 保护 层 
反射 层 


聚 爽 酸 睛 笠 辰 层 


各 
激光 发 射 、 接 收 


光头 来 读 取 盘 片上 的 信息 的 。 当 盘 片 转动 


CD-ROM 是 通过 安家 在 论 熏 驱动 体内 的 济 
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并 经 过 激光 头 时 ,激光 头 能 产生 可 以 穿 过 透明 的 聚 碳酸 酯 层 的 低 强 度 激光 束 。 激 光束 照射 
到 盘 片 的 不 同 区 域 时 ,反射 的 激光 强度 发 生变 化 。 有 具体 来 说 , 当 激 光束 照射 在 四 坑 上 时 , 巾 
于 四 坑 表 面 有 些 不 平 , 光 被 散射 ,反射 回 的 光 强 度 变 低 。 四 坑 之 间 的 区 域 称 为 台 (land), 台 
的 表面 光滑 平坦 ,反射 回 的 光 强 度 高 。 光 传 感 需 将 检测 到 的 这 种 光 强 变化 转换 成 数字 信号。 
传 感 希 以 固定 的 间隔 检测 盘 表 面 ,一 个 凹 坑 的 开始 或 结束 表示 存储 了 一 位 二 进 制 “17; 间隔 
之 间 无 标高 变动 出 现时 ,记录 的 是 “0”。 

CD-ROM 与 磁盘 在 数据 记录 方式 上 有 所 不 同 。 磁 盘 是 由 一 个 个 同心 圆 的 磁道 组 成 的 。 
而 CD-ROM 却 不 同 , 它 在 整个 盘面 上 只 有 一 条 螺旋 式 轨 道 , 由 靠近 中 心 处 开始 , 逐 阀 回 外 
旋转 直到 盘 的 外 沿 。 靠 外 的 扇 区 与 靠 内 的 扇 区 具有 相同 的 长 度 , 于 是 , 按 同 样 大 小 的 段 分 组 
的 信息 可 以 均匀 分 布 在 整个 盘 上 。 

CD-ROM 的 数据 存储 也 是 以 块 为 单位 进行 组 织 的 。 典 型 的 块 格式 如 图 5-38 所 示 。 它 
由 下 列 字 段 组 成 。 


2048 288B 
Data aUX 


图 5-38 CD-ROM 数据 块 格式 


(1) Sync: 同步 字段 ,标志 一 个 块 的 开始 。 由 12 个 字 贡 组 成 ,第 1 个 字 市 为 全 0, 第 2 一 
第 11 个 字 节 为 全 1, 第 12 个 字 节 为 全 0。 

(2) ID: 标识 字段 ,包含 块 地 址 和 模式 字 节 。 术 
使 用 纠 错 码 和 2048B 的 数据 ,模式 2 表示 不 寓 纠 错 码 的 2336B 的 用 户 数 

(3) Data: 用 户 数 据 域 。 

(4) Auxiliary: 此 辅助 域 在 模式 2 下 是 附加 用 户 数 据 , 在 模式 1 下 是 288B 的 纠 错 码 。 

与 传统 的 硬盘 相 比 ,CD-ROM 有 两 个 主要 优点 : 

(1) 价格 便宜 , 单 片 容 量 650MB, 单 位 价格 比 硬盘 低 得 多 ， 

(2) 光盘 是 可 交换 的 ,可 以 用 于 批量 制作 软件 产品 ,也 方便 用 户 存 档 和 交换 等 。 

CD-ROM 的 缺点 是 : 

(1) 它 是 只 读 的 ,不 能 修改 。 

(2) 存 取 时 间 比 磁盘 驱动 器 长 得 多 。 

CD-ROM 是 通过 专门 的 CD-ROM 驱动 项 ( 即 通 稼 所 说 的 光驱 ) 来 进行 谈 操 作 的 。CD- 
ROM 驱动 带 一 方面 完成 对 光盘 的 读 操 作 , 男 一 方面 与 主机 相 接 口 。 和 常见 的 CD-ROM 驱动 
佛 接 口 标准 主要 有 三 种 . 

1) 专用 接口 

由 各 CD-ROM 驱动 硕 生 产 广 家 提供 的 专用 接口 卡 将 CD-ROM 与 主机 连接 起 来 。 

前 专用 接口 正和 逐步 被 取代 。 

2) IDE 接口 

IDE(EIDE) 接 口 的 CD-ROM 驱动 大 直接 搬 在 计算 机 主板 上 的 IDE 或 EIDE 搬 口上 ， 
无 须 配置 总 线 接 口 卡 , 这 也 是 目前 微型 计算 机 中 普遍 采用 的 一 种 接口 方式 。 


式 0 表示 一 个 空 的 数据 域 ,模式 1 表示 
据 。 


192 


MV 
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3) SCSI 
小 型 计算 机 系统 接口 (Small Computer System Interface,.SCSI) 是 目前 比较 流行 的 输 人 
输出 接口 标准 ,相对 来 说 ,SCSI 比 IDE 接口 速度 更 快 。 


3. CD-h 


CD-R(Compact Disk Recordable) 是 一 种 一 次 写 ,多 次 读 的 可 刻录 光盘 系统 , 它 由 CD-R 盘 
片 和 刻录 光驱 组 成 。 

CD-R 光盘 与 普通 CD-ROM 光盘 在 外 观 尺 寸 、 记 载 数据 的 方式 等 方面 是 相同 的 ,也 同 
样 是 利用 激光 束 的 反射 原理 来 恋 取 信息 的 。 但 与 CD-ROM 不 同 的 是 ,在 CD-R 光盘 表面 除 
了 含有 聚 碳酸 酯 层 `\ 反射 层 和 办 和 烦 酸 树脂 保护 层 外 ,另外 还 在 聚 酉 酸 酮 层 和 反射 层 之 间 加 上 
了 一 个 有 机 染料 记录 层 。 

当 使 用 CD-R 刻录 光驱 对 空 月 盘 片 进行 刻录 时 ,是 将 写 激 光束 照射 到 有 机 染料 记录 层 
上 ,激光 照射 时 产生 的 热量 将 有 机 娄 料 烧 炊 ,并 使 其 产生 光 鲍 。 光 狗 会 使 今后 谈 激 光束 改变 
光 的 反射 靳 ,从 而 达到 一 次 刻录 改写 信息 的 目的 。 


4. CD-RW 


CD-RW(Compact Disk ReWritable) 光 存储 系统 
是 一 种 多 次 写 、 多 次 读 的 可 重复 擦 写 的 光 存 储 系 统 。 

CD-RW 光盘 结构 与 CD-ROM 基本 相同 ,只 是 在 盘 片 中 增加 了 可 改写 的 染色 层 。 读 写 
数据 及 用 相 变 (Phase Change) 技 术 。 相 变 技 术 利 用 物 奈 的 状态 变化 进行 数据 的 读 、 写 和 探 
除 。CD-RW 盘 片 内 部 乌 上 一 层 一 定 厚度 的 清 膜 即 相 变 记 录 层 。 相 变 记 录 层 由 一 种 银 合 金 
材料 组 成 , 随 加 热 温度 的 不 同 , 它 可 以 形成 晶体 ,也 可 以 形成 非 蝇 体 。 因 此 ,适当 调整 加 热 温 
度 就 可 以 自由 地 控制 记录 层 的 结 品 状态 。 在 品 体 状态 中 原子 整齐 排列 , 光 反 射 率 高 ; 相反 
在 非 品 体 状 态 中 原子 排列 不 整齐 , 光 反 射 率 低 。 对 CD-RW 的 该 、 写 和 控 除 正 是 利用 光 反 射 
率 的 这 种 变化 来 实现 的 。 由 于 材料 的 因素 , 品 体 状 态 改 变 的 次 数 有 限 ,也 使 得 CD-RW 盘 片 
的 擦 写 次 数 有 限 ， 

CD-RW 盘 片 中 的 相 变 记录 层 的 记录 膜 在 出 三 时 处 于 晶体 状态 , 写 人 时 用 强 的 激光 束 
照射 使 之 变 为 非 晶 体 状 态 , 如 果 此 时 中 止 激 光照 射 , 记 录 膜 温度 急剧 下 降 , 写 人 数据 的 区 域 
便 稳定 在 非 结 晶 状 态 ,数据 被 写 入 。 读 出 时 用 弱 的 激光 束 照 射 记 录 区 ,并 根据 反射 光 的 反射 
率 判 别 是 0 还 是 1。 仅 用 弱 光 照射 时 ,记录 膜 记 录 的 数据 不 会 被 破坏 ,这 与 普通 光驱 读 取 光 
盘 的 原理 是 一 样 的 。 在 探 除数 据 时 ,用 中 等 强度 的 油光 束 照 射 记 录 膜 ,使 其 温度 上 升 少 许 ， 
记录 膜 叉 返回 品 体 状态 ,数据 被 探 除 。 

对 CD-RW 盘 片 的 读 写 操作 是 通过 CD-RW 刻录 机 完成 的 。 目 前 的 CD-RW 刻录 机 兼 
容 CD-ROM 和 CD-R 盘 片 , 它 分 为 内 置式 和 外 置式 两 种 。 在 与 主机 接口 上 ,内 置式 刻录 机 
主要 通过 IDE、SCSI 等 接口 连接 ,而 外 置式 刻录 机 通过 计算 机 的 外 部 并 行 接口 连接 。 


[2 


5. DVD 


DVD 的 英文 全 名 是 Digital Video Disk, 即 数字 视频 光盘 。DVD 不 仅仅 用 来 存储 视频 
数据 ,还 可 以 用 来 存储 其 他 类 型 的 数据 ,因此 DVD 又 为 Digital Versatile Disk , 即 数字 通用 
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盘 , 是 一 种 能 够 保存 视频 .音频 和 计算 机 数据 的 容量 更 大 .运行 速度 更 快 的 来 用 了 MPEG2 
压缩 标准 的 光盘 。 

DVD 采用 了 类 似 CD-ROM 的 技术 ,但 是 可 以 提供 更 高 的 存储 容量 。 从 表面 上 看 ， 
DVD 盘 片 与 CD-ROM 盘 片 很 相似 ,其 直径 为 80mm 或 120mm, 厚 度 为 1. 2mm。 但 实质 
a gdb hl 相对 于 CD-ROM 光盘 650MB 的 存储 容量 ,DVD 光盘 的 存储 

量 可 以 高 达 17GB。 男 外 在 读 盘 速度 方面 ,CD-ROM 的 单 倍速 传输 束 度 是 150KB/s, 而 
DVD 的 单 倍速 传输 速度 是 1358KB/s。 

5-39 是 DVD 和 CD-ROM 盘 片 数据 记录 道 和 凹 坑 情况 的 比较 。 从 图 5-39 中 可 以 看 
出 ,CD-ROM 盘 的 道 间 距 为 1. 6um, 而 DVD 盘 的 道 间 距 为 0.74xm; CD-ROM 盘 的 最 小 四 
坑 为 0.83um, 而 DVD 盘 的 最 小 四 坑 为 0. 4wm。DVD 盘 片 的 道 密度 和 四 坑 密 度 都 远 高 于 
CD 盘 片 。 单 从 这 两 方面 的 改进 ,就 使 DVD 的 单 片 单 层 容量 提高 到 CD-ROM 的 7 信和 多 , 
达 4.7GB。 


Eh 一 一 道 间 距 1.6pm | 王道 间距 0.74hm 


几 二 小 回 坑 0.4pnm 


， 
最 小 四 坑 0.8 apd | | 
县 


(a) CD-ROM 盘 (bl) DVD 盘 


5-39 DVD 盘 与 CD 盘 的 凹 坑 密 度 比 较 


DVD 盘 片 分 为 单 面 单 层 . 单 面 双 层 、 双 面 单 层 和 双 面 双 层 4 种 物理 结构 。 因 此 ,可 以 将 
DVD 盘 片 分 为 4 种 规格 ,分 别 是 DVD-5.DVD-9.DVD-10 和 DVD-18, 它 们 的 容量 分 别 如 


表 5-8 所 示 。 


表 5-8 4 种 DVD 盘 片 比较 

盘 片 类 型 盘 片 直径 /cm 面 数 / 层 数 容量 /GB 
DVD-5 12 单 面 单 层 4.7 
DVD-9 12 单 面 双 层 8.5 
DVD-10 12 双 面 单 层 9. 4 
DVD-18 12 双 面 双 层 17 


无 论 是 单 层 盘 还 是 双 层 盘 , 都 是 由 两 片 基 底 组 成 ,每 片 基底 的 厚度 均 为 0.6mm, 因 此 
VD 盘 片 的 厚度 为 1. 2mm。 对 于 单 面 盘 来 说 ,只 有 下 层 基 底 包 含 数据 ,上 层 基 底 没 有 数 
据 。 而 双 面 盘 的 上 下 两 层 基 底 均 包含 数据 。 

从 读 写 功能 上 ,DVD 盘 片 也 分 为 两 类 : 只 读 型 和 可 擦 写 型 。 只 读 型 DVD 包括 用 于 计 
算 机 辅助 存储 器 的 DVD-ROM 和 用 于 存储 音频 .视频 的 DVD-Audio 及 DVD-Video; 可 控 
写 型 DVD 主要 有 一 次 可 刻录 的 DVD-R 和 多 次 可 控 除 .可 改写 的 DVD-RW 等 。 
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5.4 RAID 技术 


计算 机 技术 发 展 到 今天 ,使 得 人 们 可 以 在 包括 微型 计算 机 在 内 的 各 种 机 带 中 配置 大 容 
量 磁盘 。 而 在 此 之 前 ,只 有 在 一 些 大 型 计算 机 系统 中 根据 其 应 用 的 需要 才 配 备 大 容量 磁盘 
系统 。 那 时 ,大 容量 磁盘 的 价格 还 相当 高 ,对 工作 环境 的 要 求 也 非常 高 。 昌 然 那 时 磁盘 的 可 
知性 已 很 高 ,但 对 磁 盐 不 恰当 的 使 用 仍然 容易 造成 磁盘 的 损坏 。 一 旦 磁盘 损坏 ,就 会 造成 不 
可 收复 的 磁 盐 错误 ,将 使 其 在 商业 .科研 及 学 术 等 领域 造成 不 可 佑 量 的 损失 。 因 此 使 用 单一 
的 磁盘 存储 重要 的 数据 总 存在 安全 问题 。 解 决 数据 存储 安全 问题 的 主要 方法 是 使 用 磁 审 机 
年 设备 进行 数据 备份 。 这 种 方法 虽然 可 机 上 提高 数据 的 安全 性 ,但 一 方面 数据 
的 备份 需要 科学 合理 的 安排 和 严格 的 制度 来 保障 ; 为 一 方面 今后 对 数据 的 检索 工 作 相当 
烦琐 。 

1988 年 ,美国 加 州 大 学 Berkeley 分 校 的 David Patterson ,Garth Gibson 和 Randy Katz 
三 人 发 表 了 一 志 题 为 ACase of Redundant Array of Inexpensive Disks(《 有 廉价 磁 扒 元 余 阵 
列 方案 》) 的 论文 , 自 次 提出 了 了 RAID 一 词 。 在 论文 中 他 们 提出 将 多 个 小 容量 价格 低廉 的 磁 
盘 进 行 有 机 组 合 , 来 蔡 代 通常 在 大 型 计算 机 中 使 用 的 昂 贯 的 大 容量 磁盘 系统 ,并 使 其 具有 更 
好 的 性 能 和 更 高 的 可 靠 性。 在 这 篇 论文 中 ,Patterson Gibson 和 Katz 还 定义 了 5 种 类 型 
( 称 为 级 ,level) 的 RAID, 每 一 级 RAID 都 具有 不 同 的 性 能 和 可 徘 性 。 以 前 这 些 级 的 编号 是 
从 1 到 5, 后 来 人 们 又 定义 了 RAID 的 第 0 级 和 第 6 级 。 所 以 RAID 主要 分 为 7 个 级 , 即 从 
第 0 级 到 第 6 级。 当然 ,一 些 研 究 机 构 和 公司 还 定义 了 其 他 一 些 RAID 级 ,但 7 级 RAID 是 
业界 普遍 认同 的 标准 。 

已 er 的 本 是 通过 在 多 个 硬盘 上 (又 称 为 磁盘 阵列 ) 同 时 存 取 数据 来 
大 幅 提 高 磁盘 存储 系统 的 数 量 的 ,而 且 在 一 些 RAID 模式 中 通过 较为 完备 的 相互 校 
验 / 恢 复 的 措施 ， 其 至 是 直接 相互 的 镜像 备份 以 提高 RAID 系统 的 容错 度 ,从 而 提高 了 磁盘 
存储 系统 的 安全 性 和 可 靠 性 。RAID 的 这 一 设计 思想 很 快 被 接受 ,从 此 RAID 技术 得 到 了 
广泛 应 用 ,数据 存储 进入 了 更 快速 .更 安全 .更 廉价 的 新 时 代 。 

表 5-9 对 RAID 分 级 进行 了 概括 。 
表 5-9 RAID 分 级 

磁盘 数 容错 性 能 并 行 IO 响应 
N 无 容错 
镜像 2N 容错 性 最 好 

专用 海 明 校 验 盘 位 分 布 磁盘 系统 Nm 允许 一 个 磁盘 失效 
专用 奇偶 校 验 盘 位 分 布 磁盘 系统 NT1 允许 一 个 磁盘 失效 
专用 奇偶 校 验 盘 分 块 独立 存 取 磁 盘 系统 N 十 1 允许 一 个 磁盘 失效 
分 散 校 验 分 块 独立 存 取 磁盘 系统 N 允许 一 个 磁盘 失效 
分 散 双 校 验 分 块 独立 存 取 磁盘 系统 N 允许 两 个 磁盘 失效 


RAID 级 


= 
i 


1. RAIDO 


RAID0O 全 称 是 Striped disk array without fault tolerance( 没 有 容错 的 条 璐 位 盘 阵 列 )， 
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其 构 染 如 图 5-40 所 示 。 


到 5-40 ”RAID0 的 分 条 带 数据 组 织 


图 5-40 中 一 个 圆 盘 就 是 一 个 磁盘 (以 下 同 ) ,磁盘 以 条 人 市 (CStrip ) 的 形式 划分 ,每 个 条 市 
是 一 些 物 理 的 块 、 扇 区 或 其 他 单位 。 所 有 的 磁盘 组 成 一 个 逻辑 磁盘 ,系统 数据 和 用 户 数 据 被 
看 成 存储 在 这 个 逻辑 磁盘 上 。 逻 辑 磁 盘 上 的 一 个 个 条 市 数据 以 轮转 方式 映射 到 连 绥 的 阵列 
磁盘 中 。 例 如 ,在 一 个 由 NN 个 磁盘 组 成 的 阵列 中 ,逻辑 磁盘 的 第 1 一 第 N 个 条 带 数据 按 顺 
序 依次 分 布 在 第 1 一 第 N 个 磁盘 的 第 1 个 条 市 上 ,第 NT 二 1 一 第 2N 个 条 市 数据 按 顺 序 依 次 
分 布 在 第 1 一 第 N 个 磁盘 的 第 2 个 条 带 上 ,…, 以 此 类 推 。 这 种 布局 的 优点 是 ,如 果 单 个 
1/O 请 求 由 多 个 逻辑 相 邻 的 条 带 组 成 , 则 对 多 达 N 个 条 带 的 请 求 可 以 并 行 处 理 , 这 样 可 以 
大 大 提高 W/O 的 数据 传输 率 。 

实际 上 ,RAIDO 有 些 类 似 在 计算 机 主 存 中 灯 用 的 交叉 存储 
并 行 存 取 提高 主机 对 磁盘 的 访问 速度 。 每 个 磁盘 都 有 自己 独立 的 访问 控制 电路 ,能 够 独立 
地 进行 数据 的 传输 。 而 逻辑 磁盘 和 物理 磁盘 间 的 数据 映射 则 在 一 个 磁盘 阵列 管理 系统 (由 
软件 或 硬件 实现 ) 的 统一 控制 下 完成 。 

不 过 ,RAID0 不 是 RAID 家 族 中 的 真正 成 员 , 因 为 它 没有 数据 元 余 能 力 。 由 于 没有 采 
用 备份 或 校 验 恢复 技术 ,在 人 AIDO 阵列 中 任何 一 个 磁盘 损坏 就 会 导致 整个 磁盘 阵列 数据 的 
损坏 ,因为 数据 都 是 分 布 存储 的 。 而 且 ,RAIDO 磁盘 阵列 的 整体 可 靠 性 会 随 着 磁盘 数量 的 
增加 而 降低 。 例 如 ,如 果 阵 列 由 5 个 磁盘 组 成 ,每 个 磁盘 的 设计 寿命 为 50 000 小 时 ,那么 整 
个 系统 的 期 望 设计 寿命 为 50 000/5 二 10 000 小 时 。 当 磁盘 数量 进一步 增加 时 ,磁盘 阵列 失 
效 的 概率 会 随 之 增加 ,最 后 达到 某 个 不 确定 的 值 。 


2. RAIDIT 


RAID1 又 称 为 磁盘 镜像 (Disk Mirroring) ,是 所 有 的 RAID 级 中 具有 最 佳 失 效 保 护 世 


一 种 方案 。 它 使 用 两 组 互 为 镜像 的 磁盘 进行 简单 的 完全 数据 备份 ,从 而 实现 数据 宛 余 , 如 
图 5-41 所 示 。 


入 


到 5-41 RAID1 的 磁盘 镜像 
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图 5-41 中 包含 了 两 组 相同 的 磁盘 阵列 。RAID1 在 每 次 写 入 时 ,部 会 同时 将 数 
两 组 磁盘 中 ,使 两 组 磁盘 的 数据 保持 完全 相同 ,以 实现 磁盘 阵列 的 高 可 靠 性 。 

RAID1 也 采用 与 RAID0O 相同 的 条 市 数据 划分 , 即 在 每 组 内 ,所 有 磁盘 以 条 市 方式 进行 
数据 组 织 ,以 保持 与 RAIDO 同样 的 高 性 能 。 

与 RAIDO 相 比 ,RAID1 具有 以 下 特点 : 

(1) 一 个 读 请 求 可 由 包含 请 求 数 据 的 两 组 磁盘 中 的 某 一 个 提供 服务 ,只 要 它 的 寻 道 时 
间 加 旋转 延迟 较 小 。 因 此 ,RAID1 具有 比 RAIDO 更 优 的 读 性 能 。 万 其 是 在 一 些 面 回 事务 
的 应 用 场合 , 当 需 要 对 磁盘 进行 大 量 数据 谈 取 时 ,RAID1 的 性 能 甚至 能 接近 达到 人 RAIDO 性 
能 的 两 倍 。 

(2) 一 个 写 请求 需 要 更 新 两 组 磁盘 中 两 个 对 应 的 条 带 ,而 这 组 磁盘 的 写 操作 可 以 并 行 
进行 。 因 此 , 写 性 能 由 两 者 中 较 慢 的 一 个 写 操 作 来 决定 , 即 包 含 较 大 的 寻 违 时 间 和 旋转 延迟 
的 那 一 个 与 。 

(3) 恢复 一 个 损坏 的 磁盘 很 简单 。 当 一 个 磁 


盘 损 坏 时 ,数据 仍 能 从 与 之 镜像 的 磁盘 中 


RAID1 的 主要 缺点 是 价格 昂贵 , 它 需 要 文 持 两 倍 于 逻辑 磁盘 的 磁盘 空间 。 因 此 ， 
RAID1 的 配置 常用 在 存储 关键 的 系统 数据 和 用 户 数据 的 场合 中 。 在 这 种 情况 下 ,RAID]1 
对 所 有 的 数据 提供 实时 备份 ,即使 一 个 磁盘 损坏 ,所 有 的 关键 数据 仍 能 立即 可 用 。 


3. RAID2 


RAID1 虽然 同时 具有 高 可 靠 性 和 高 性 能 ,但 它 的 主要 问题 是 成 本 太 大 ,需要 整整 两 倍 
于 实际 所 需 的 磁盘 数量 才能 达到 数据 元 余 。 更 好 的 方式 是 只 使 用 磁盘 组 中 的 一 个 或 几 个 磁 
盘 用 于 数据 宛 余 或 数据 校 验 之 用 。RAID2 就 定义 了 这 些 方法 中 的 一 种 。 
RAID2 称 为 海 明 码 校 验 (Hamming Code ECC) , 它 将 磁盘 进行 条 市 划分 的 方法 运用 了 
极端 的 情形 。 它 在 每 个 条 市 中 只 写 入 一 位 二 进 制 位 ,而 不 是 灯 用 像 RAIDO 和 RAID1 中 的 
数 。 这 样 的 话 , 如 果 以 字 节 为 单位 进行 数据 组 织 , 则 一 个 磁盘 阵列 中 至 少 需要 8 个 磁盘 
用 于 丰 储 数据 信 奶 。RAID2 采用 了 海 明 纠 错 码 进行 数据 校 验 。 与 数据 磁盘 相对 应 ,磁盘 阵 
列 中 还 需要 一 组 磁盘 用 于 存储 纠 钳 伍 傅 息 ,如 图 5-42 所 示 。 


图 5-42 ”RAID2 的 采用 海 明 码 校 验 的 分 条 高 数 据 组 织 
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纠 错 码 所 需 的 磁盘 数量 取决 于 所 来 用 的 海 明 纠 错 码 所 需 的 校 验 位 数 。 无 论 是 数据 盘 还 
是 校 验 盘 ,只 要 有 一 个 磁盘 损坏 ,其 中 的 数据 都 可 以 通过 海 明 人 码 来 重建 恢复 。 

因为 每 个 磁盘 都 只 写 人 1 位 数据 ,因此 整个 RAID2 的 磁盘 组 就 好 像 是 一 个 大 型 的 数据 
磁盘 。 所 有 的 磁盘 数据 (包括 数据 盘 和 校 验 盘 ) 都 必须 严格 地 同步 ,否则 数据 变 乱 会 使 得 海 
明码 起 不 到 校 验 的 作用 。 由 于 系统 对 磁盘 的 读 写 是 按 位 并 行 执行 的 ,因此 数据 传输 率 高 。 
但 由 于 生成 海 明 码 较为 耗 时 ,所 以 RAID2 对 大 多 效 商 业 应 用 来 说 速度 太 慢 。 事 实 上 ,今天 
大 多 数 磁 盘 驱 动 硕 痢 有 内 置 的 CRC 纠 错 功能 。 对 于 单个 磁盘 和 驱动 各 具有 高 可 徘 性 的 情 
况 下 ,RAID2 就 没有 太 大 的 应 用 意义 了 ，。 


4. RAID3 

RAID3 称 为 市 校 验 的 并 行 传输 (Parallel Transfer with Parity)。 像 RAID2 一 梓 ， 
RAID3 是 按照 每 次 一 位 的 方式 将 数据 交错 分 配 到 各 个 数据 盘 的 条 市 上 。 但 是 ,与 RAID2 
所 不 同 的 是 ,RAID3 只 使 用 一 个 磁盘 来 存储 一 个 简单 的 奇偶 校 验 位 ,如 图 5-43 所 示 。 这 种 
奇偶 校 验 位 可 以 使 用 简单 的 硬件 快速 计算 出 来 ,具体 方法 是 对 分 布 在 每 一 个 磁盘 上 的 每 一 
个 数据 位 (D,) 进 行 异 或 运算 (对 偶 校 验 ) ,生成 的 偶 校 验 位 存储 到 校 验 盘 上 。 例 如 ,假设 磁 
盘 组 共有 8 个 数据 磁盘 ,分布 在 这 8 个 盘 上 的 数据 位 分 别 为 D, 一 D,; , 则 偶 检 验 位 为 


P 一 也, 由 也 | 由 也 出 站 由 也 由 中 DOD; 
| CD 
0 , 


其 中 P 位 存储 到 校 验 盘 中 ，。 
校 驼 伺 三 一 


数据 傍 盘 
图 5-43 ”RAID3 的 采用 奇偶 校 验 码 的 分 条 带 数 据 组 织 


利用 相同 的 方法 可 以 在 确认 了 和 采 一 磁盘 损坏 的 情况 下 ,很 方便 地 对 该 磁盘 数据 进行 
重建 。 例 如 ,假说 上 例 中 的 5 号 磁盘 损坏 了 ,并 且 被 蔡 换 反 。 用 户 可 以 通过 对 其 他 剩余 
的 数据 磁盘 和 校 验 磁 盘 的 对 应 数据 进行 以 下 偶 校 验 运 算 , 即 可 重新 生成 损坏 了 了 的 磁盘 上 
的 数据 : 


Di = Du 由 D 由 D 由 Di 由 D, WD De WD D1 DP 
当然 ,RAID3 也 要 求 使 用 与 RAID2 同样 的 数据 复制 方法 和 同步 操作 ,以 人 免 造 成 数据 的 
混乱 。 巾 于 只 使 用 了 一 个 校 验 盘 用 于 数据 的 恢复 ,因此 ,RAID3 比 RAIDI1 和 RAID2 都 更 


5. RAID4 


RAID2 和 RAID3 都 采用 了 将 数据 以 位 为 单位 分 布 到 各 个 数据 磁盘 上 的 方式 ,对 数据 
的 读 写 必 须 在 所 有 盘 上 同时 进行 。 因 此 ,RAID2 和 RAID3 不 适合 多 个 并 行 IO 的 响应 。 
而 RAID4 到 RAID6 痢 米 用 了 一 种 独立 的 存 取 方式 ,磁盘 阵列 中 的 每 个 磁盘 的 操作 部 
立 的 ,从 而 也 就 能 同时 啊 应 多 个 W/O 请 求 。 
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RAID4 叉 称 为 市 有 共 侍 校 验 磁盘 的 独立 数据 磁盘 系统 (Independent Data Disks with 
Shared Parity Disk) 。 它 与 RAID3 一 样 ,同样 采用 ”数据 磁盘 十 奇偶 校 验 盘 ”的 组 织 形式 ,如 
图 5-44 所 示 。 但 与 RAID3 不 同 的 是 ,RAID4 不 是 以 位 为 单位 进行 数据 读 写 的 。 它 将 所 有 


磁盘 划分 成 大 小 相同 的 条 市 ,每 个 条 市 能 存储 一 个 块 的 数据 。 


要 给 公克 副 


数据 们 盘 
图 5-44 RAID4 的 市 奇偶 校 验 磁盘 的 独立 数据 磁盘 组 织 


以 验方 法 是 每 次 对 每 个 数据 盘 上 的 对 应 条 市 的 同一 位 进行 奇偶 校 验 运 算 生 成 这 一 位 的 
奇偶 校 验 位 对 应 一 个 数据 条 市 也 就 生成 一 个 奇偶 校 验 条 市 。 例 如 ,假设 某 个 由 4 张 磁盘 
组 成 的 RAID4 磁盘 系统 的 条 带 单 位 是 字 市 ,4 个 磁盘 上 对 应 的 一 个 条 种 分 别 为 S。、S1、S;、 
Si ,与 这 一 条 市 对 应 的 侦 校 验 条 市 为 P, 则 

P(1) 王 So(1) 中 SC 中 S: (1)DS5;(1) 
P(2) 一 S,(2) 中 Si 02) 由 S (2) 中 S;(2) 


P(8) 一 Su(8) 中 Si (8) 中 9 (8) 中 5S; (8) 

RAID4 的 这 种 奇偶 校 验 组 织 方式 能 有 效 地 解决 对 并 行 IO 的 啊 应 问题 。 但 它 的 写 效 
率 却 较 低 。 对 于 每 一 次 与 操作 ,磁盘 阵列 管理 系统 不 仅 要 修改 用 户 数据 ,而且 要 修改 相应 的 
奇偶 校 验 位 。 对 于 上 例 来 说 ,假设 某 次 与 操作 只 在 Sl 条 市 上 执行 

初始 时 ,对 每 位 i 有 下 列 关系 式 : 

P(i)=S, (75 (05, (0) D5; 0) 
修改 后 ,可 能 改变 的 位 以 撤 号 ”表示 : 
P(i)= $0(i) 中 S51(i) © 5,(i) O 5; (7) 
= S$0(i) 中 S10) 中 SG) 中 SG) OB 51(i) W@W S10) 
= SG 中 SG) OB 5,0) 中 SG) 中 SG) D 510) 
= P(i) 中 SG) 中 SG) 

从 上 式 可 以 看 出 ,为 了 计算 新 的 奇偶 校 验 位 ,系统 必须 读 取 旧 的 数据 条 市 和 奇偶 校 验 条 
市 ,然后 用 新 的 数据 和 新 计算 出 的 奇偶 校 验 位 修改 上 述 两 个 条 市 。 因 此 ,每 个 条 市 的 写 操 作 
包括 两 次 读 和 两 次 写 ,使 得 写 操 作 效 率 比 较 低 。 

从 RAID4 的 构架 和 写 操作 可 以 看 出 ,RAID4 的 校 验 盘 是 整个 系统 的 关键 , 它 的 失效 会 
市 来 整个 系统 的 失效 。 正 因为 这 个 原因 ,限制 了 了 AID4 的 实际 应 用 。 


6. RAIDS 


RAID5 的 全 称 是 市 分 散 校 验 盘 的 分 条 市 数据 磁盘 系统 (Striping with Floating Parity 
Drive) , 它 是 对 RAID4 加 以 改进 的 优化 方案 。 对 RAID4 而 言 , 校 验 盘 是 独立 的 , 校 验 盘 的 
失效 将 种 来 整个 磁盘 系统 的 失效 ,因此 校 验 盘 成 为 RAID4 的 瓶颈 。RAID5 则 是 将 奇偶 检 
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图 5-45 ”RAID5 的 带 分 散 校 验 盘 的 分 条 带 数 据 磁盘 组 织 


在 图 5-45 中 ,对 条 带 (S,、Si、S;)、(S;、S4、Ss )、(Ss 、S;、Ss )、(S,、Si、Sun ) 的 校 验 条 带 
P,,、P3s、Pses 和 Pi 分 布 在 不 同 的 磁盘 上 。 这 样 一 方面 保存 了 RAID4 原 有 的 独立 磁盘 所 
市 来 的 并 行 /O 啊 应 能 力 , 男 一 方面 又 较 好 地 解决 了 RAID4 的 校 验 盘 瓶颈 问题 。 但 相对 
来 说 ,RAID5 的 磁盘 控制 功能 是 最 复杂 的 。 

RAID5 是 目前 在 商业 上 得 到 了 很 好 应 用 的 RAID 方案 之 一 。 


71. RAIDG 


前 面 所 讨论 的 大 多 数 RAID 系统 只 能 允许 最 多 有 一 个 人 磁盘 失效 。 但 实际 情况 是 大 型 计 
算 机 系统 的 磁盘 第 币 有 发 生成 群 成 族 失 歼 的 现象 。 发 生 这 种 情况 一 般 有 两 大 原因 : 一 是 几 
乎 同一 时 间 生 产 的 磁盘 会 在 相同 的 时 间 里 到 达 它 们 预期 的 使 用 寿命 ; 二 是 磁盘 的 损坏 通 第 
是 由 于 某 些 灾难 性 事件 引起 的 ,如 电源 故障 等 。 如 有 条 在 第 一 个 损坏 的 磁盘 还 未 来 得 及 更 换 
之 前 第 二 个 磁盘 又 损坏 了 ,那么 整个 磁盘 系统 将 毅 汗 。RAID6 就 是 为 解决 这 种 问题 而 提出 
的 一 种 方案 。 

RAID6 是 由 一 些 大 型 企业 提出 来 的 私有 RAID 级 别 标 准 ,全 称 为 带 有 两 个 独立 分 布 式 
校 验方 案 的 独立 数据 磁盘 (Independent Data Disks with Two Independent Distributed 
Parity Schemes)。 它 是 在 RAID5 的 基础 上 发 展 而 成 的 ,因此 它 的 工作 模式 与 RAID5 有 相 
似 之 处 。 所 不 同 的 是 RAID5 只 使 用 了 一 种 奇偶 校 验 人 码 , 并 只 写 和 人 一 个 人 磁盘 上 ; 而 RAID6 
除 使 用 了 奇人 蛋 校 验 但 外 ,还 使 用 了 一 种 Reed-Soloman 纠 销 编码 来 提供 第 二 层 保 护 ,并 将 这 
两 种 校 验 码 写 人 两 个 不 同 的 磁盘 中 。 这 样 就 增强 了 磁盘 的 容 铬 能 力 , 人 允许 磁盘 阵列 中 出 现 
故障 的 磁盘 可 以 达到 两 个 ,图 5-46 是 RAID6 的 组 织 架 构图 ， 


里 然 RAID6 有 更 强 的 容错 能 力 ,; 但 直到 最 近 , 还 没有 实际 了 两 业 配置 的 RAID6 系统 。 主 
要 有 两 个 方面 的 原因 :; 一 是 生成 Reed-Soloman 编码 需要 相当 大 的 费用 代价 ; 二 是 在 
RAID6 系统 中 ,更 新 磁盘 上 的 纠 错 编 码 要 求 双 倍 的 读 写 操作 。 


计算 机 组 织 与 结构 


8. 混合 RAID 系统 


许多 大 型 的 计算 机 系统 并 不 局 限于 只 使 用 一 种 类 型 的 RAID。 在 某 些 情况 下 ,平衡 磁 
芭 系 统 的 高 可 用 性 和 经 济 性 是 非常 重要 的 。 例 如 ,人 们 可 能 希望 使 用 RAIDI1 来 保护 包含 操 
作 系 统 文 件 等 诸如 此 类 重要 数据 ,而 对 于 用 户 数据 文件 使 用 RAID5 就 足够 了 了 。RAIDO 非 
第 适合 于 存放 大 程序 运行 过 程 中 产生 的 临时 文件 ,并 有 昌 RAIDO 高 效 并 行 IO 访问 特别 适 
合 于 频 和 过 磁盘 操作 的 多 进程 运行 。 

用 户 还 可 以 将 多 个 人 AID 方案 组 合 起 来 构建 一 种 "新 型 2 的 人 了 AID。 其 中 了 人 AID10 就 是 
这 样 一 种 磁盘 系统 , 它 组 合 了 RAIDO 的 分 市 方式 和 RAID1 的 镜像 功能 。 虽 然 代价 时 贵 ,但 
是 RAID10 可 以 提供 优良 的 读 取 性 能 和 最 佳 的 可 用 性 。 

最 后 ,通过 表 5-10 总 结 一 下 RAID0 一 RAID6 的 优 缺 点 及 适应 的 应 用 场合 。 


表 $-10  RAID0 一 RAID6 的 优 缺 点 及 应 用 


RAID 级 应 有 


(1) 文 持 并 行 IO 的 处 理 | | : 


RAIDO | 一 人 | (z) 没有 磁盘 数据 容错 能 力 及 其 他 并 行 IO 处 理 的 


3) 使 用 和 配置 简章 (3) 随 磁 盘 数 的 增加 可 靠 性 降低 | 频 度 较 高 的 应 用 

(1) 具有 最 佳 失效 保护 功能 一 些 需 要 数据 高 可 徘 性 
RAID1 | (2) 对 磁盘 的 读 取 速度 最 快 | J 元 余 磁 盘 最 : 的 行业 ,如 金融 ,政府 部 

(3) 使 用 和 配置 简单 门 等 

(1) 即时 的 数据 校 验 , 具 有 较 

好 的 数据 恢复 功能 

(2) 并 行 数据 传输 速度 快 ,但 


和 we 
一 次 只 能 执行 个 1/0 请 来 。 | 号 至 整个 磁盘 阵列 读 写 速度 慢 


(1) ECC 占用 比例 较 大 
(2) ECC 的 生成 成 本 高 且 费 时 , | 目前 的 实际 应 用 较 少 


K AIDz 
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(1) 简单 高 效 的 校 验 功能 , 具 , 

有 较 好 的 数据 恢复 功能 和 ope 

RAID3 盘 控 制 器 设计 比较 复杂 及 其 他 需要 较 高 数据 人 
(2) 并 行 数据 传输 速度 快 ,但 | 人 和 区 这 症 岂 入 避 和 ost 据 传 

一 次 只 能 执行 一 个 IO 请 求 | 


效 盘 控制 器 设计 非常 复杂 
(1) 高 效率 的 数据 校 验 功能 数据 恢复 及 重建 工作 复杂 
(2) 支持 并 行 IO 的 处 理 (3) 写 效率 低 
(4) 校 验 盘 成 为 系统 瓶颈 


RAID4 在 


商业 上 没有 得 到 应 用 


(1) 高 效率 的 数据 校 验 i 实际 应 用 较 广 ,包括 应 用 


RAID5 | “1 总 检 证 有 歼 据 悦 吾 习 朋 | 磁盘 控制 器 设计 非常 复杂 于 各 种 数据 库 服务 器 . 文 
(2?2) 垃 行 /QO) 的 外 
2) 文 持 并 行 IO 的 处 理 件 和 应 用 服务 器 等 


(1) 最 强 的 磁盘 容错 功能 ,多 | (1) 磁盘 控制 器 设计 非常 复杂 
RAID6 | 许 两 个 磁盘 同时 失效 (2) 写 效 率 很 低 目前 的 实际 应 用 较 少 
(2) 支持 并 行 W/O 的 处 理 (3) 校 验 码 占用 磁盘 空间 较 多 


知识 拓展 
网 络 存储 系统 

随 着 Internet 的 发 展 , 网 络 上 大 量 的 数据 需要 存储 ,人 们 对 更 加 简便 、 快 速 、 安全 地 
存储 数据 的 需求 对 存储 系统 的 容量 和 速度 提出 了 室 前 的 了 要求。 传统 的 以 服务 器 为 中 
心 的 DAS(Direct Attached Storage) 方 式 ( 这 种 方式 是 将 RAID 硬 盘 阵 列 直 接 安 淮 到 
络 系统 的 服务 器 上 ) 已 不 能 满足 用 户 的 需要 , 越 来 越 多 的 用 户 已 经 从 原来 的 以 “服务 器 
中 心 ” 模 式 转 挽 为 以 “数据 为 中 心 ” 的 网 络 存 和 储 模式 上 ,这 其 中 较为 广泛 使 用 的 是 NAS 
和 SAN。 

NAS 的 人 全称 是 Network Attached Storage, 中 文 翻译 为 网 络 和 直接 存储 ,其 构架 如 
5-47(a) 所 示 。 在 NAS 存储 结构 中 ,存储 系统 不 再 通过 I/O 总 线 附 属于 某 个 特定 的 服 
务 器 或 客户 机 , 它 完 全 独立 于 网 络 中 的 主 服务 器 ,可 以 看 作 一 个 专用 的 数据 或 文件 服务 
器 。NAS 包括 处 理 器 磁盘 系统 和 数据 管理 模块 。NAS 和 服务 器 、 客 户 机 一 起 连接 成 网 
络 , 客 尸 机 对 数据 的 访问 不 再 需要 服务 器 的 干预 ,允许 客 尸 机 与 NAS 之 间 进 行 直 接 的 数 
据 功 问 。 

SAN 的 全 称 是 Storage Area Network, 中 文 翻译 为 存储 区 域 网 络 , 其 构 沫 如 图 5-47(b) 
所 示 。 在 SAN 结构 中 ,各 种 存储 设备 通过 光纤 及 光纤 通道 交换 机 与 服务 器 一 起 连接 成 高 
速 网 络 , 使 与 服务 器 连接 成 LAN 的 客户 机 可 以 非 第 方便 地 访问 存储 设备 。 在 SAN 结构 
中 ,每 一 个 应 用 服务 器 上 应 安装 文件 管理 系统 ,客户 机 对 存储 系统 中 的 文件 的 访问 必须 通过 
服务 器 进行 。 


EE 
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(a) NAS (b) SAN 


图 5-47 网 络 存储 系统 


本 章 主 要 讲述 了 以 下 内 容 : 

(1) 输入 输出 接口 的 组 成 与 功能 ,CPU 对 输入 输出 设备 的 编 址 和 管理 。 

(2) 输入 输出 的 传输 控制 方式 ,包括 程序 控制 方式 .中断 控制 方式 .DMA 控制 方式 和 通 
道 方 式 等 。 这 些 不 同 的 控制 方式 在 CPU 利用 率 .数据 传输 效率 等 方面 各 有 不 同 , 分 别 应 用 
于 对 不 同 设备 的 输入 输出 控制 。 

(3) 外 部 存储 器 的 组 织 。 介 绍 了 磁盘 存储 器 、 磁 媒 
工作 原理 。 

(4) RAID 技术 。 包 括 人 AID1 一 RAID6 的 磁盘 组 织 、 校 验 及 元 余 技 术 的 应 用 等 。 


BES 据 组 织 织 及 


2，I/O 接口 3. 1/O 端口 4. 中 断 
6. 单 级 中 断 7. 多 级 中 断 8. 中 断 般 套 
10. 通道 11. 磁道 12. 届 区 

. 磁盘 访问 时 间 15. 人 磁盘 数据 传输 率 16. RAID 


1. ey ) 。 
A. ddl B. 中 断 服 务 程序 人 口 地 址 
程 D， 中断 返回 地 址 
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2. 为 了 便于 实现 多 级 中 上 断 ， 保存 现 驾 信 息 最 有 效 的 方法 是 采用 ( ) 。 
A. 通用 寄存 冀 B. 堆栈 C. 辅 存 D. 通道 
3. 如 果 有 多 个 中 断 同时 发 生 ,系统 将 根据 中 断 优 先 级 啊 应 优先 级 最 高 的 中 断 请 求 , 右 
要 调整 中 断 事 件 的 中 断 处 理 次 序 , 可 以 利用 ( ) 。 
A. 中 断 租 大 B. 中 断 问 量 C， 中 断 啊 应 D. 中 上 断 屏 蔽 
4. 在 米 用 DMA 方式 高 速 传输 数据 时 ,数据 传送 是 ( ) 。 
A. 在 总 线 控 制 苍 发 出 的 控制 信号 控制 下 完成 的 
B. 在 DMA 控制 器 本 身 发 出 的 控制 信号 的 控制 下 完成 的 
C. 由 CPU 执行 的 程序 完成 的 
D. 由 CPU 啊 应 便 中 断 处 理 完成 的 
5. 下 列 陈 述 中 正确 的 是 ( js 
A. 在 DMA 周期 内 ,CPU 不 能 执行 程序 
B. 中 断 发 生 时 ,CPU 首先 执行 人 栈 指令 将 程序 计数 需 的 内 容 保护 起 来 
C. DMA 传送 方式 中 ,DMA 控制 右 每 传送 一 个 数据 就 急 取 一 个 指令 周期 
D. 输入 输出 操作 的 最 终 目的 是 实现 CPU 与 外 设 之 间 的 数据 传输 
般 来 讲 , 主 机 与 硬盘 之 间 的 数据 交换 比 软盘 快 , 其 主要 原因 是 ( ) 。 
A. 便 盘 有 多 个 盘 片 
B. 便 盘 有 来 用 密封 式 安 滁 
C. 煞 盘 使 用 的 是 锅 片 尘 健 " 基 证 转速 
D. 硬盘 容量 更 大 
7. 以 下 可 用 作 数 据 备份 之 用 的 光盘 是 ( ) 。 
A. CD-R B. CD-ROM C. CD-RW D. CD 
8. 以 下 不 具有 校 验 恢 复 机 制 的 RAID 技术 是 ( hs 
A. RAIDO B. RAID] C. RAID? D. RAID3 
下 列 有 关 I/O 接口 的 叙述 中 错误 的 是 ( )。(2014 年 全 国 硕 士 人 研究 生 人 学 统一 
考 egestas 合 试 题 ) 
A. 状态 端口 和 控制 端口 可 以 合用 同一 寄存 带 
B. 1/O 接口 中 CPU 可 访问 寄存 器 称 为 1/O 端口 
C. 采用 独立 编 址 方式 时 ,1/O 端口 地 址 和 主 存 地 址 可 能 相同 
D. 采用 统一 编 址 方式 时 ,CPU 不 能 用 访 存 指令 访问 1/O 端口 
10. 某 设 备 中 断 请 求 的 相应 和 人 处理 时 间 为 100ns, 每 400ns 发 出 一 次 中 断 请 求 , 中 断 响 
应 所 允许 的 最 长 延迟 时 间 为 50ns, 则 在 该 设备 持续 工作 过 程 中 CPU 用 于 该 设备 的 1/O 时 
间 占 整个 CPU 时 间 百 分 比 至 少 是 ( )。(2014 年 全 国 硕士 研究 生 人 学 统一 考试 计算 机 
学 科 专 业 基 础 综合 试题 ) 
A. 12.5% B. 25% C. 37.5% D. 50% 
11. 下 列 ; :高 RAID 可 徘 性 的 措施 有 ( ) 。(2013 年 全 国 硕士 研究 生 人 


先 项 中 ,用 于 质 
a 
1 . 磁盘 镜像 .条 市 化 咱 . 奇偶 校 验 .增加 cache 机制 
A. 仅 ]、]l B. 仅 工 .由 C. 仅 工 开 和 RN D. 仅 工 .下 和 K 
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12. 某 磁盘 的 转速 为 10 000 转 / 分 ,平均 寻 道 时 间 是 6ms ,磁盘 传输 速率 是 20MB/s , 磁 
盘 控 制 姑 延迟 为 0.2ms, 读 取 一 个 4KB 的 悄 区 所 需 的 平均 时 间 约 为 ( )。(2013 年 全 国 
儒 士 全 究 生 人 学 统一 考试 计算 机 学 科 专 业 基 础 综合 试题 ) 
A. 9ms B. 9. 4ms C. l2ms D. 12.4ms 
13. 下 列 关于 中 断 1/O 方式 和 DMA 方式 比较 的 叙述 中 ,错误 的 是 ( ) 。(2013 年 全 
国 硕士 研究 生 人 学 统一 考试 计算 机 学 科 专 业 基 础 综合 试题 ) 
A. 中 断 IO 方式 请 求 的 是 CPU 处 理 时 间 ,DMA 方式 请 求 的 是 总 线 使 用 权 
B. 中 断 啊 应 发 生 在 一 条 指令 执行 结束 后 ,DMA 响应 发 生 在 一 个 总 线 事务 完成 后 
C. 中 断 IO 方式 下 数据 传送 通过 软件 完成 ,DMA 方式 下 数据 传送 由 便 件 完成 
D. 中 断 IO 方式 适用 于 所 有 外 部 设备 ,DMA 方式 仅 适 用 于 快速 外 部 设备 
14. 啊 应 外 部 中 断 的 过 程 中 :中断 隐 指 令 完 成 的 操作 除 保 护 断 点 外 ,还 包括 ( ) 。 
(2012 年 全 国 硕 十 研究 生 人 学 统一 考试 计算 机 学 科 专 业 基 础 综合 试题 ) 
工 . 关中 断 ” 开 . 保存 通用 寄存 器 的 内 容 ”有 轩 . 形成 中 断 服 务 程序 人 口 地 址 并 送 PC 
A. 仅 工 . 工 B. 仅 [ 并 C. 仅 工 、 看 D. 工 .TI、 焉 
三 、 综 合 题 
1. IO 接口 一 般 由 哪些 部 件 组 成 ? 1/O 接口 主要 应 实现 哪些 功能 ? 
2. 对 IO 端口 的 编 址 主要 有 了 哪 两 种 方式 ? 
3. 计算 机 都 有 哪些 输入 输出 传输 控制 方式 ?” 这 些 方式 各 有 何 特点 ? 分 别 应 用 于 什么 
样 的 场合 ? 
4. 计算 机 系统 中 的 中 断 源 是 怎样 分 类 的 ? 都 有 哪些 中 断 源 ? 
5. 简 述 中 断 系 统 的 中 断 处 理 过 程 。 
6. 中 断 啊 应 所 实现 的 功能 主要 有 哪些 ? 
7. 简 述 采用 中 断 向 量 法 的 中 断 啊 应 过 程 
8 
9 


. 简 述 DMA 的 传输 控制 过 程 。 

. 通道 与 DMA 有 什么 不 同 ? 

10. 通道 主要 有 了 哪些 种 类 ? 它们 各 有 何 特点 ?分 别 适合 与 什么 样 的 设备 连接 ? 

11. 光盘 主要 有 哪些 种 类 ? 

12. 设 某 机 器 中 断 系 统 有 5 级 中 断 ABC、D、E, 其 中 断 响 应 优先 级 由 高 到 低 顺 序 为 
A 一 BC 一 D 一 EE, 现 要 求 将 中 断 处 理 次 序 改 为 B 一 D 一 A 一 E 一 C, 试 问 : 

(1) 下 表 中 各 级 中 断 处 理 程序 的 各 中 断 屏 蔽 码 如 何 设 置 (“1? 表 示 屏 蔽 中 断 , 0? 表示 开 
放 中 汤 )? 

(2) 奢 在 执行 一 个 CPU 程序 时 这 5 级 中 断 同时 痢 发 出 中 断 请 求 , 按 更 改 后 的 次 序 画 出 
各 级 中 断 啊 应 和 中 断 处 理 的 过 程 示意 图 。 


win 
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13， 设 其 磁盘 存储 和 骨 转 速 为 7200r/min; 平 均 找 道 时 间 为 10ms, 每 道 存储 容 
600Kb , 求 磁盘 的 平均 存 取 时 间 和 数据 传输 率 。 

14. 设 某 磁盘 存储 船 转 速 为 3000r/ min, 共 有 18 个 记录 面 ,每 面 有 20 000 个 磁道 ,每 道 
存储 容量 为 300Kb ,每 道 扇 区 数 为 600, 试 求 : 

) 磁盘 存储 甫 的 总 存储 容量 。 

(2) 磁盘 数据 传输 率 。 

(3) 磁盘 的 平均 等 竺 时间。 

(4) 每 鹿 区 的 容量 

(5) 给 出 一 个 磁盘 地 址 格式 方案 。 

. 设 某 磁 带 机 有 9 个 磁道 , 带 长 600m, 带 速 2m/s, 每 个 数据 块 1KB, 块 间隔 14mm ,和 若 

改 ， 人 率 为 128 000B/s, 试 求 ， 

(1) 磁 市 的 记录 黎 度 

(2) 在 带 的 首尾 各 空 2m, 求 磁带 最 大 有 效 存 储 容 量 。 

6. 有 一 台 磁 盘 机 ,其 平均 找 道 时 间 为 30ms, 平 均等 待 时 间 为 10ms, 数 据 传 输 率 ; 
ion 1000 个 文件 ,每 个 文件 为 3000KB。 现 需要 将 所 有 文件 逐个 取 
走 , 更 新 后 再 放 回 原 处 (文件 大 小 不 变 ) ,已 知 对 每 个 文件 更 新 所 需 时 间 为 4ms, 且 更 新 操作 
与 磁盘 读 写 不 相 重 登 。 试 问 : 

(1) 更 新 磁盘 上 所 有 文件 并 重新 写 回 磁盘 共 需 多 少时 间 ? 
(2) 若 磁盘 机 转速 提高 一 倍 , 则 更 新 磁盘 上 所 有 文件 并 重新 写 回 磁盘 共 需 多 少时 间 ? 
. RAID 有 哪些 分 级 ? 各 有 什么 特点 ? 
. 设 革 单位 要 构建 一 个 采用 双 机 磁盘 元 余 阵 列 系 统 ( 使 用 人 RAID1) , 试 查阅 质料 ,给 出 
有 
19. 革 计算 机 的 CPU 主 频 为 500MHz,CPI 为 5( 即 执行 每 条 指令 平均 需 5 个 时 钟 周 
期 )。 假 定 某 外 设 的 数据 传输 率 为 0. 5MB/s, 采 用 中 断 方式 与 主机 进行 数据 传送 ,以 32 位 
为 传输 单位 ,对 应 的 中 断 服 务 程序 包含 18 条 指令 ,中断 服 务 的 其 他 开销 相当 于 2 条 指令 的 
执行 时 间 。 请 回答 下 列 问 题 ,要 求 给 出 计算 过 程 。(2009 年 全 国人 硕士 钱 究 生 入 学 统一 考试 
计算 机 和 学科 专业 基础 综合 试题 ) 
(1) 在 中 断 方 式 下 ,CPU 用 于 该 外 设 LO 的 时 间 占 整个 CPU 时 间 的 百分比 是 多 少 ? 
(2) 当 该 外 设 的 数据 传输 率 达 到 5MB/s 时 , 改 用 DMA 方式 传送 数据 。 假 设 每 次 
DMA 传送 大 小 为 5000B, 且 DMA 预 处 理 和 后 处 理 的 总 开销 为 500 个 时 钟 周 期 , 则 CPU 用 
于 该 外 设 1/O 的 时 间 占 整个 CPU 时 间 的 百分比 是 多 少 ( 假 设 DMA 与 CPU 之 间 没 有 访 存 
冲突 )? 
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在 计算 机 内 部 ,CPU 与 存储 器 .输入 输出 接口 之 间 需 要 互 连 , 这 种 互 连 采 用 的 是 总 线 结 
构 ; 在 计算 机 外 部 ,主机 与 输入 输出 设备 以 及 主机 与 主机 之 间 也 需要 互 连 , 这 种 互 连 是 使 用 
标准 总 线 接 口 进行 的 。 

本 章 首先 讲述 计算 机 内 部 各 部 件 之 间 的 总 线 互 连结 构 , 介 绍 总 线 的 基本 概念 ,总 线 的 类 
别 和 总 线 的 控制 方式 等 ; 然后 列举 几 种 现代 微机 中 常用 的 总 线 标准 ,如 ISA、PCI 等 ; 最 后 
介绍 几 种 目前 在 计算 机 中 常用 的 外 部 总 线 接口 标准 ,如 USB、IEEE 1394 和 SCSI 等 。 


6.1 互 连 结构 

在 第 1 章 已 介绍 过 ,计算 机 从 硬件 上 讲 主 要 由 CPU ,存储 占 和 输入 输出 接口 等 组 成 , 它 
们 不 是 孤立 的 部 件 , 而 是 需要 互相 交换 信息 的 ,因此 ,它们 之 间 需 要 通过 基 种 方式 互 连 。 
图 6-1 给 出 了 CPU ,存储 器 和 输入 输出 接口 需要 交换 的 信息 种 类 。 


阁 握 、 地 址 
主 存 柳 据 
捕 仔 效 气 


图 6-1 CPU、 存 储 器 和 1/O 接口 交换 的 信息 种 类 


在 计算 机 中 ,主要 的 通信 和 包括 以 下 几 种 。 

(1) 存储 器 到 CPU: CPU 从 存储 器 中 读 指 令 或 数 
艇 给 出 地 址 信号 并 发 出 读 控 制 信 号 。 

(2) CPU 到 存储 器 : CPU 向 存储 器 中 写 人 
也 址 信号 和 写 人 的 数据 ,并 发 出 写 探 制 信和 号。 

(3) 1/O 到 CPU: CPU 从 1/O 接口 中 读数 据 ,为 完成 这 一 工作 ,CPU 要 向 TI/O 接口 给 
出 地 址 信和 号 并 发 出 读 控 制 信号 ,I/O 接口 向 CPU 提供 设备 状态 信号 和 向 CPU 发 出 中 断 请 
求 等 控制 信号 。 

(4) CPU 到 IO: CPU 向 IO 接口 中 写 人 数据 ,为 完成 这 一 工作 ,CPU 要 向 1/O 接口 
给 出 地 址 信号 和 写 入 的 数据 ,并 发 出 写 控制 信号 ,1/O 接口 回 CPU 提供 设备 状态 信号 和 加 


是 ,为 完成 这 一 工作 ,CPU 要 向 存储 


据 ,为 完成 这 一 工作 ,CPU 要 向 存储 器 给 


出 
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CPU 发 出 中 断 请 求 等 控制 信号 。 

(5) 1/O 与 存储 器 之 间 : 对 于 这 种 情况 ,1/O 接口 代替 CPU 控制 IO 设备 与 存储 器 之 
间 进 行 直 接 数据 传输 (如 DMA 方式 )。 

对 于 多 个 部 件 之 间 的 通信 ,可 以 有 多 种 互 连 方式 ,如 图 6-2 所 示 给 出 的 是 几 种 常见 的 部 
件 互 连结 构 。 


(a) 环 型 (b) 全 互 连 (c) 星 型 (d) 总 线 型 
图 6-2 ” 几 种 常见 的 部 件 互 连结 构 


(1) 环 型 结构 。 所 有 部 件 连接 成 一 个 环 状 , 环 是 所 有 部 件 通信 的 公共 通路 。 这 一 结构 
的 缺点 是 环 的 故障 或 任 一 部 件 的 故障 部 将 使 整个 系统 通信 和 瘫痪。 

(2) 全 互 连 结 构 。 所 有 部 件 部 一 一 相连 ,这 种 结构 的 优点 是 并 行 性 好 ,两 两 部 件 之 间 可 
以 同时 通信 。 但 缺点 是 使 用 的 信号 线 多 ,每 增加 一 个 部 件 需要 增加 n 组 信号 线 , 过 多 的 信号 
线 会 使 计算 机 系统 的 设计 变 得 十 分 复杂 。 

(3) 星 型 结构 。 由 一 个 核心 部 件 与 其 他 部 件 一 一 相连 。 这 种 结构 虽然 从 理论 上 讲 符合 
CPU 作为 计算 机 硬件 核心 与 其 他 部 件 一 一 相连 的 模式 ,但 实际 上 是 不 可 行 的 ,因为 CPU 每 
与 一 个 部 件 相 连 就 需要 增加 一 组 重复 的 引出 信号 线 , 这 对 CPU 的 设计 来 说 是 不 现实 的 。 
万 外 ,计算 机 系统 是 一 个 多 主 设备 和 多 从 设备 互 连 的 系统 , 右 将 CPU 放置 在 核心 位 置 , 其 
他 主 设备 就 无 法 独立 对 从 设备 实施 控制 。 

(4) 总 线 纺 构 。 这 种 方式 是 将 所 有 部 件 连接 在 一 组 公共 信号 线 上 ,总 线 是 所 有 部 件 通 
信 的 公共 通路 。 这 一 结构 非 第 适合 于 计算 机 系统 各 部 件 的 互 连 , 其 原因 : 一 是 连接 续 构 催 
单 , 整 个 系统 互 连 信 与 线 最 少 ; 二 是 部 件 之 间 通 过 共 圣 的 总 线 进行 通信 并 不 影 啊 并 行 性 ， 
因为 在 计算 机 系统 中 ,更 多 的 场合 总 是 一 个 主 设备 与 一 个 从 设备 进行 通信 ,即使 发 生 同 
时 有 多 个 主 设备 和 多 个 从 设备 通信 的 情况 ,也 可 以 通过 合理 的 设计 和 调度 较 好 地 解决 并 
行 性 问题 。 

多 年 来 ,人 们 通过 答 试 各 种 互 连 纺 构 , 迄 今 为 止 在 计算 机 中 普遍 采用 的 是 总 线 互 连 
后 构 。 


6.2 总 线 互 连 


总 线 是 目前 计算 机 中 各 部 件 互 连 的 一 种 主要 方式 。 本 节 主 要 介绍 总 线 的 基本 概念 、 计 
算 机 中 常见 的 总 线 互 连结 构 和 总 线 控制 方式 。 

6.2.1 总 线 的 基本 概念 

总 线 (Bus) 是 一 组 信号 线 , 用 于 将 两 个 或 两 个 以 上 部 件 连接 起 来 ,形成 部 件 之 间 的 公共 
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通信 通路 ,每 个 部 件 将 自己 的 信号 线 与 总 线 相连 。 

总 线 具 有 以 下 两 个 最 主要 的 特点 : 

(1) 共享 性 。 总 线 是 供 所 有 部 件 进行 通信 所 共享 的 ,任何 两 个 部 件 之 间 的 数据 传输 都 
是 通过 共享 的 公共 总 线 进行 的 。 

(2) 独占 性 。 一 旦 有 一 个 部 件 占 用 总 线 与 另 一 个 部 件 进 行 数据 通信 ,其 他 部 件 就 不 能 
绸 使 用 总 线 ,也 就 是 说 ,一 个 部 件 对 总 线 的 使 用 是 独占 的 。 之 所 以 这 样 ,是 因为 计算 机 的 总 
线 是 由 一 组 传输 电信 号 的 信号 线 组 成 的 ,在 任何 时 候 一 条 信号 线 的 有 效 状 态 或 者 为 “0” 或 者 
为 “1”( 这 种 “0”“1” 状 态 是 通过 信号 线 的 电压 值 来 表示 的 ), 才 同 时 有 两 个 部 件 问 某 条 信号 
线 发 送 数据 ,其 中 一 个 将 信号 线 置 “1”, 男 一 个 置 “0”, 这 将 导致 信号 线 处 于 不 稳定 状态 ,也 就 
是 说 ,一 条 信号 线 无 法 同时 接纳 两 个 或 两 个 以 上 部 件 对 其 状态 的 设置 。 

有 趣 的 是 ,总 线 的 英文 单词 与 公共 汽车 (Bus) 相 同 。 实 际 上 ,可 以 将 总 线 与 公共 汽车 道 
路 作 一 个 对 比 。 首 先 , 相 同 之 处 : 计算 机 中 的 总 线 是 所 有 连接 在 其 上 的 部 件 所 发 出 信息 传 
输 的 公共 通路 ,而 公共 汽车 道 也 是 从 所 有 站 发 出 的 公共 汽车 行驶 的 公共 通路 ; 不 同 之 处 : 
对 计算 机 的 总 线 而 言 , 一 旦 有 一 个 部 件 发 出 的 信息 在 总 线 上 传输 ,其 他 部 件 就 不 能 再 使 用 总 
线 , 这 是 由 总 线 的 特性 所 决定 的 ; 而 对 公共 汽车 道 而 言 , 同 一 时 刻 允 许多 个 站 发 出 的 汽车 在 
其 上 行驶 。 

从 图 6-1 计算 机 各 功能 部 件 之 间 所 交换 的 信息 种 类 可 以 看 出 ,总 线 中 主要 包含 地 址 信 
息 、 数 据 信息 和 控制 及 状态 信息 等 。 因 此 ,根据 总 线 的 功能 划分 , 总线 包括 地 址 总 线 
(Address Bus,AB) ,数据 总 线 (Data Bus,DB) 和 控制 总 线 (Control Bus,CB) ,另外 ,总 线 也 
提供 电源 线 和 接地 线 等 。 

(1) 地 址 总 线 : 地 址 总 线 上 传送 的 是 由 CPU 等 主 设备 发 往 从 设备 的 地 址 信号 。 当 
CPU 对 存储 天 或 IO 接口 进行 读 写 时 ,首先 必须 给 出 所 要 访问 的 存储 髓 单元 的 地 址 或 IO 
缴 口 的 地 址 ,并 在 整个 读 写 周期 一 直 保 持 有 效 。 

(2) 数据 总 线 : 数据 总 线 上 传送 的 是 各 部 件 之 间 交 换 的 数据 信息 。 数 据 总 线 通 第 是 双 
回 的 , 即 数 据 可 以 是 由 从 设备 发 往 主 设备 ( 称 为 读 或 输入 ) ,也 可 以 是 由 主 设备 发 往 从 设备 
( 称 为 写 或 输出 )。 

(3) 控制 总 线 : 控制 总 线 上 传送 的 是 一 个 部 件 对 另 一 个 部 件 的 控制 或 状态 信号 ,如 
CPU 对 存储 器 的 读 、 写 控制 信号 ,外 部 设备 同 CPU 发 出 的 中 断 请 求 信 号 等 。 

总 线 按 其 所 连接 的 不 同 部 件 或 设备 划分 可 分 为 以 下 几 类 

1) 系统 总 线 

在 现代 计算 机 系统 中 ,CPU ,存储 各 和 部 分 输入 输出 接口 都 设计 在 机 各 的 主板 上 ,主板 
上 还 会 设计 一 些 IO 插 槽 (又 称 为 1/O 通道 ) 用 于 接 持 一 些 1/O 设备 适配器 ,通过 这 些 适 配 
佛 连 接 I/O 设备 。 用 于 将 CPU ,存储 右 和 输入 输出 接口 及 1/O 通道 连接 起 来 的 一 组 信号 线 
就 称 为 系统 总 线 。 系 统 总 线 是 计算 机 系统 最 核心 的 一 条 总 线 , 它 的 设计 迄 
标准 或 规范 ,具有 相同 标准 系统 总 线 的 机 器 通常 在 硬件 上 是 菲 容 的 。 

计算 机 的 系统 总 线 通 常 具 有 三 态 性 , 即 高 电 平 状态 (通常 用 于 表示 “1”) , 低 电 平 状态 ( 通 
常用 于 表示 “0”) 和 高 阻 状态 。CPU 在 正常 工作 状态 下 ,其 总 线 中 的 信号 线 或 者 处 于 高 电 乎 
状态 ,或 者 处 于 低 电 平 状态 ,而 当 CPU 需要 将 总 线 的 控制 权 交 给 其 他 DMA 控制 器 等 主 设 
备 时 , 它 会 将 其 连接 的 总 线 置 为 高 阻 状态 。 正 是 因为 总 线 的 这 种 三 态 性 ,使 得 多 个 主 设备 可 
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以 同时 连接 在 总 线 上 。 

一 些 实际 系统 总 线 的 例子 ,如 ISA、EISA、MCA 、STD、VME 、MultiBus、PCMCIA、 
PCI 等 ， 

2) 局 部 总 线 

随 着 计算 机 对 CPU 访 存 速度 和 图 像 处 理 速 度 的 要 求 越 来 越 高 ,现代 机 器 往往 采用 多 
总 线 结构 设计 ,即将 CPU 与 存储 器 及 显示 器 适配器 相连 接 的 信号 线 从 系统 总 线 中 分 离 出 
来 ,形成 CPU 与 存储 峰 和 CPU 与 显示 需 适 配器 之 间 的 专用 总 线 , 称 为 局 部 总 线 。 

局 部 总 线 一 般 是 CPU 芯片 引 脚 的 延伸 ,与 CPU 密切 相关 。 局 部 总 线 的 设置 可 以 大 大 
提高 CPU 与 存储 髓 或 显示 器 适 配 更 之 间 的 数据 传输 速率 。 

3) 外 部 总 线 

外 部 总 线 主要 是 指 计算 机 与 计算 机 计算 机 与 外 部 设备 之 间 的 通信 和 总线 。 一 些 已 形成 
工业 标准 的 外 部 总 线 除 了 对 总 线 的 信号 线 功 能 和 通信 规程 等 进行 了 定义 外 ,还 对 机 天 之 间 
或 机 器 与 设备 之 间 的 接口 标准 也 做 了 规定 。 例 如 ,用 于 微型 计算 机 之 间 进 行 串 行 数据 通信 
之 用 的 RS-232/RS-485 接口 标准 ,微机 与 外 部 设备 之 间 的 USB 和 IEEE 1394 通用 串 行 总 
线 接口 标准 等 。 

衡量 总 线性 能 的 主要 技术 指标 是 总 线 市 宛 , 它 是 指 总 线 所 能 达到 的 最 高 数据 传输 率 , 单 
位 是 兆 字 节 / 秒 (MB/s) 。 总 线 市 宽 在 一 定 程度 上 影 啊 到 机 天 的 整体 性 能 ,总 线 所 能 提供 的 
最 局 数据 传输 座 也 在 不 断 提 高 。 例 如 微型 计算 机 系统 中 来 用 的 标准 总 线 , 其 市 宽 从 ISA 总 
线 的 8MB/s 发 展 到 EISA 总 线 的 33MB/s,PCI 总 线 的 133MB/s,PCI-X 总 线 的 1066MB/s 
又 发 展 到 现在 的 PCI-E 总 线 的 10GB/s 甚至 更 高 。 


6.2.2 总 线 互 连结 构 


计算 机 各 部 件 之 间 的 总 线 互 连 结构 随 春 计算 机 人 性 能 的 不 断 提 局 也 在 不 断 发 生 春 变化 ， 
这 种 变化 主要 体现 在 两 个 方面 : 一 是 由 单 总 线 结构 四 多 总 线 结构 发 展 ; 二 是 通过 增加 局 部 
总 线 , 提 高 CPU 与 一 些 部 件 之 间 数 据 交换 的 速度 。 


1. 单 总 线 结构 


单 总 线 结构 是 指 CPU 存储 右 和 各 种 设备 接口 之 间 通 过 单条 总 线 相 连 ,CPU 与 存储 天 
及 各 种 设备 接口 之 间 的 数据 通信 都 是 通过 这 条 单 总 线 进行 的 ,如 图 6-3 所 示 。 单 总 线 结构 
是 早期 计算 机 普遍 采用 的 一 种 总 线 互 连结 构 ,在 这 种 机 各 中 ,无 论 是 快速 还 是 慢 速 的 各 种 设 
备 的 接口 都 和 主 存 储 右 一 起 连接 在 同一 总 线 上 ,因此 对 总 线 带 宽 的 要 求 不 能 很 高 ,这 也 就 限 
制 了 CPU 对 一 些 相 对 高 速 的 部 件 ( 如 主 存 ) 的 访问 速度 。 


[和 
针 | 


图 6-3 单 总 线 结构 
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-eR 局 部 总 线 结 构 


随 着 CPU 性 能 的 不 断 提高 ,CPU 与 主 存 之 间 的 速度 差异 越 来 越 成 为 提高 机 需 整 体 性 
能 的 瓶颈 之 一 。 为 了 减 小 这 种 差异 ,提高 CPU 的 访 存 速度 ,计算 机 开始 逐步 使 用 高 速 缓存 
(cache) ,并 将 之 集成 在 计算 机 主板 上 。 高 速 组 存 的 速度 比 主 存 速度 更 快 , 为 充分 发 挥 其 作 
用 ,在 CPU 与 高 速 缓存 之 间 设 置 一 条 专用 总 线 , 又 称 存 储 总 线 或 局 部 总 线 ， 它 的 总 线 之 宽 
更 宽 ,专用 于 CPU 与 高 速 缓存 之 间 的 数据 交换 。 使 用 了 局 部 总 线 的 总 线 互 连结 构 如 图 6-4 
所 示 。 


LO 接口 


LO 接口 


3. 多 总 线 结构 


局 部 总 线 所 具有 的 优势 是 明显 的 ,同时 它 也 为 总 线 结构 的 发 展 葛 定 了 良好 的 基础 。 在 
计算 机 中 ， 不 仅仅 是 存储 右 需 要 与 CPU 之 间 进 行 高 速 互 连 。 多 媒体 技术 的 发 展 对 计算 机 
的 图 像 处 理 速度 提出 了 更 高 的 要 求 ; 高 速 局 域 网 的 发 展 对 计算 机 网 络 传输 速度 的 要 求 越 来 
越 高 ; 男 外 ,CPU 与 磁盘 等 高 速 辅 存 之 间 也 同样 需要 高 速 数 据 交 换 , 这 就 导致 了 在 计算 机 
完 中 米 用 多 总 线 结构 。 多 总 线 结 构 的 基本 思想 是 ; 根据 所 连接 部 件 或 设备 性 能 的 不 同 ， 
锋 系 统 中 配置 多 条 总 线 , 原 则 上 根据 部 件 或 设备 的 束 东 度 进行 分 类 ,将 高 速 部 件 通过 高 速 
总 线 与 CPU 互 连 ,低速 部 件 通 过 低速 总 线 与 CPU 互 连 。 计 算 机 系统 的 多 总 线 结构 如 图 6-5 
所 示 。 

图 6-5 中 ,CPU 与 主 存 之 间 通 过 传统 的 系统 总 线 互 连 , 而 与 高 速 缓 存 之 间 则 使 用 一 条 
专用 高 速 存 储 总 线 连接 ; 系统 中 的 一 些 高 速 部 件 ( 如 主机 与 SCSI 硬盘 的 SCSI 接口 、 
口 和 网 络 接口 等 ) 均 连接 在 一 条 高 速 总 线 上 ,高 速 总 线 通 过 一 个 “ 桥 ” 与 系统 总 线 相连 ; 

慢 速 设备 则 连接 在 低速 总 线 上 ,低速 总 线 通 过 男 一 个 “ 桥 ” 与 高 速 总 线 相 连 


6.2.3 总 线 的 控制 方式 
1. 总 线 的 仲裁 


在 第 5 章 中 介绍 过 ,计算 机 系统 的 部 件 分 为 主 设备 和 从 设备 , 主 设备 是 指 能 够 通过 总 线 
控制 和 访问 从 设备 的 部 件 , 如 CPU; 而 从 设备 是 被 主 设备 控制 和 访问 的 部 件 , 如 存储 大 。 
在 机 熏 系 统 中 ,有 可 能 发 生 多 个 主 设备 同时 申请 使 用 已 线 的 情况 ,但 由 于 总 线 的 特性 决定 了 
在 同一 时 刻 只 允许 一 个 主 设备 占用 总 线 , 因 此 ,对 于 多 个 主 设备 同时 申请 总 线 的 情况 需要 进 
行 总 线 仲 裁 。 
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低 


妹 忆 线 
低速 低速 低速 
设备 设备 设备 
图 6-5 多 总 线 结构 


按照 总 线 仲 裁 电 路 的 位 置 不 同 , 仲 裁 方 式 分 为 集中 式 仲 裁 和 分 布 式 仲 裁 两 种 。 

(1) 集中 式 仲裁 。 由 一 个 称 为 总 线 控制 右 或 仲裁 器 的 人 硬件 设备 负责 对 多 个 主 设备 使 用 
总 线 申请 的 裁决 。 总 线 仲裁 器 可 以 是 独立 的 部 件 ,也 可 以 是 CPU 的 一 部 分 。 常 用 的 集中 
式 仲 裁 方式 主要 有 : 链 式 查询 方式 .计数 带 定 时 查询 方式 和 独立 请 求 方式 等 。 无 论 哪 种 方 
式 ,申请 总 线 的 主 设备 与 总 线 仲 裁 器 之 间 至 少 需要 两 条 信和 号 线 的 连接 ,一 是 总 线 请 求 信和 号 线 
BR ,一 是 总 线 授 权 信 号 线 BG 。 

链 式 查询 方式 。 如 图 6-6(a) 所 示 , 总 线 授权 信号 BG 串 行 地 从 一 个 设备 传送 到 下 一 个 
设备 ,如 果 BG 到 达 的 设备 无 总 线 请 求 , 则 继续 往 下 查询 ; 如 果 BG 到 达 的 设备 有 总 线 请 求 ， 
BG 信和 号 就 不 再 往 下 传 ,该 设备 就 获得 了 总 线 使 用 权 , 建 立 总 线 忙 信号 BS。 链 式 查询 方式 的 
优点 是 只 需 很 少 几 根 线 就 能 按 一 定 优 先 次 夺 实 现 总 线 仲裁 ,而 且 很 容易 扩充 设备 ; 缺点 是 
对 电路 故障 较 敏 感 ,如 果 第 i 个 设备 电路 出 现 故 障 , 那 么 第 i 个 以 后 的 设备 都 不 能 进行 工 
作 。 男 外 链 式 查询 方式 不 能 保证 公正 性 , 即 一 个 低 优 先 级 设备 的 请 求 可 能 长 期 得 不 到 人 允许， 
因而 优先 级 较 低 的 设备 可 能 长 期 不 能 使 用 总 线 。 

计数 器 定时 查询 方式 。 如 图 6-6(b) 所 示 ,计数 郑 定 时 查询 方式 比 链 式 查询 方式 多 了 一 
组 设备 地 址 线 , 少 了 一 根 总 线 授 权 线 BG。 总 线 上 的 任 一 设备 要 使 用 总 线 时 ,通过 BR 线 发 
出 总 线 请 求 , 总 线 仲裁 器 收 到 总 线 请 求 信号 后 ,在 总 线 未 被 使 用 (BS 二 0) 的 情况 下 让 计数 器 
开始 计数 ,并 将 计数 值 通过 一 组 地 址 线 发 往 各 设备 ,当地 址 线 上 的 计数 值 与 某 个 有 总线 请 求 
的 设备 地 址 相 一 致 时 ,该 设备 建立 总 线 忙 信号 (BS 二 1), 获 得 总 线 使 用 权 , 此 时 终止 计数 查 
询 。 计 数 


器 的 初 值 可 由 程序 设置 ,这 就 可 以 方便 地 改变 设备 的 优先 级 。 若 每 次 计数 都 
开始 ,此 时 各 设备 的 优先 次 序 与 链 式 查询 方式 相同 ,优先 次 序 是 固定 的 ; 车 每 次 计数 的 
总 是 从 上 次 的 中 止 点 开始 , 则 每 个 设备 使 用 总 线 的 优先 级 就 是 相等 的 。 计 数 器 定时 查询 方 
式 是 以 增加 线 数 作为 代价 来 换取 灵活 的 优先 次 序 的 。 

独立 请 求 方式 。 图 6-6(c) 给 出 的 是 一 个 采用 独立 请 求 方式 的 集中 式 总 线 仲裁 电路 图 。 
每 个 设备 都 有 一 对 总 线 请 求 线 BRi 和 总 线 授权 线 BGi。 当 设备 要 使 用 总 线 时 , 便 发 出 总 线 
请 求 信号 ,总线 仲 裁 器 按照 一 定 的 优先 次 序 决定 首先 响应 哪个 设备 的 请 求 ,然后 发 给 设备 总 
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MV 


线 授权 信号 BGi。 总 线 仲裁 器 可 以 给 各 个 请 求 线 以 固定 的 优先 级 ,也 可 以 设置 可 编程 的 优 
先 级 。 该 方式 的 优点 是 响应 速度 快 ,缺点 是 控制 线 数量 多 。 


忆 


ne TT 1 L 


(a) 和 链 式 查询 方式 


| 
设备 由 | | 
下 三 一 有 三 一 
RR 1 1 | 机 | 


ll Wd 


(b) 计数 荐 定时 得 询 方式 


(c) 独立 请 求 方式 
到 6-6 集中 式 总 线 仲裁 


假设 用 n 表示 允许 挂 接 在 总 线 上 的 最 大 设备 数 , 则 链 式 查询 方式 只 需 两 根 裁决 线 , 计 数 
器 定时 查询 方式 需要 log:” 根 裁决 线 ,而 独立 请 求 方式 需要 2 根 裁决 线 ， 

(2) 分 布 式 仲裁 。 总 线 仲裁 电路 分 散 于 连接 在 总 线 上 的 各 个 主 设备 中 。 分 布 式 仲裁 不 
需要 中 央 仲 裁 器 ,每 个 主 设备 都 有 自己 的 仲裁 号 和 仲裁 器 。 当 它们 有 总 线 请 求 时 ,把 它们 叭 
一 的 仲裁 号 发 送 到 共享 的 仲裁 总 线 上 ,每 个 仲裁 器 将 仲裁 总 线 上 得 到 的 号 与 自己 的 号 进行 
比较 。 如 果 仲 裁 总 线 上 的 号 大 , 则 它 的 总 线 请 求 不 予 响应 ,并 撤销 其 仲裁 号 ,最 后 ,获胜 者 的 
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仲裁 号 保留 在 仲裁 总 线 上 。 显 然 , 分 布 式 仲裁 是 以 优先 级 仲裁 策略 为 基础 的 。 
2. 总 线 的 定时 


总 线 的 定时 是 指 为 完成 一 次 总 线 操作 主 、 从 设备 所 给 出 的 地 址 、 数 据 及 控制 信号 在 时 序 
上 的 关系 。 总 线 的 时 序 关 系 分 为 同步 时 友和 异步 时 序 。 

1) 同步 时 序 

在 同步 时 序 下 ,总 线 中 包含 一 条 时 钟 信 号 线 , 总 线 上 的 所 有 操作 都 与 时 钟 信号 同步 。 时 
钟 信 号 是 一 个 由 等 宽 的 高 、 低 电位 交替 出 现 的 规则 信和 号 ,一 次 高 . 低 电 位 的 交替 称 为 一 个 时 
钟 周期 ,每 一 个 时 钟 周期 中 都 含有 一 个 上 升 沿 和 一 个 下 降 沿 ,总 线 上 的 操作 正 是 通过 由 时 钟 
周期 的 上 升 沿 或 下 降 沿 触发 来 实现 同步 的 。 图 6-7 给 出 了 一 个 典型 的 同步 总 线 操作 时 序 。 


地 址 允许 


数据 线 
污 控制 


效 据 线 
写 周 期 


写 控制 


图 6-7 同步 总 线 操 作 时 序 


图 6-7 中 ,一 次 总 线 操作 需要 4 个 时 钟 周期 T1 一 T4, 它 们 构成 一 个 总 线 周 期 。 主 设备 
在 第 1 个 时 钟 周 期 的 开始 就 给 出 所 访问 的 从 设备 的 地 址 信号 ,并 保持 在 整个 总 线 周 期 有 效 。 
右 是 谈 周 期 , 则 主 设备 需 给 出 对 从 设备 的 读 控 制 信号 ,经 过 一 段 时 间 后 ,从 设备 将 数据 读 出 
到 数据 总 线 上 。 知 是 写 周期 , 则 主 设备 需 给 出 对 从 设备 的 写 控制 信号 ,并 将 要 写 人 的 数据 放 
到 数据 总 线 上 ,经 过 一 段 时 间 后 写 入 从 设备 。 所 有 地 址 、 数 据 和 控制 信和 号 都 在 时 钟 周期 的 上 
升 沿 或 下 降 沿 开始 有 效 。 

同步 时 序 的 优点 是 控制 南 单 、 实 现 容 多 ; 缺点 是 对 各 种 操作 来 说 电线 周期 往往 是 相同 
的 ,这 对 于 短 操作 (所 需 时 间 短 ) 来 说 ,在 时 间 上 就 有 些 浪 费 。 

2) 寞 步 时 厅 

在 异步 时 序 中 ,后 一 操作 出 现在 总 线 上 的 时 刻 取 决 于 前 一 操作 的 发 生 , 即 前 后 操 
在 应 答 式 基础 上 ,各 种 操作 的 产生 不 需要 统一 的 公共 时 钟 信号 。 图 6-8 给 出 了 一 个 典 玫 
异步 总 线 操作 时 序 。 

异步 时 序 的 优点 是 总 线 周期 长 度 可 变 , 这 对 于 快速 和 慢 速 的 操作 来 讲 都 能 做 到 高 效 ; 
缺点 是 控制 复杂 ,需要 以 更 多 的 硬件 成 本 为 代价 。 
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地 直线 稳定 的 地 址 


主 设备 
旋 控 制 


从 设备 
应 答 


效 据 线 


读 出 的 数据 
6-8 ”异步 总 线 操 作 时 序 
3. 总 线 的 数据 传输 


当代 的 总 线 标 准 大 都 能 支持 以 下 4 种 模式 的 数据 传输 。 

1) 单个 字 的 读 、 写 操作 

单个 字 的 读 .与 操作 即 一 次 总 线 操作 完成 一 个 字 的 读 或 与 操作 , 字 的 宽度 通 稼 与 总 线 宽 
度 一 致 。 读 / 写 操作 都 是 由 主 设 备 发 起 的 , 读 操 作 是 由 从 设备 到 主 设备 的 数据 传送 ; 写 操 作 
是 由 主 设备 到 从 设备 的 数据 传送 。 每 次 的 字 传 输 操 作 都 是 首先 由 主 设 备 给 出 字 单 元 地 址 ， 

然后 给 出 读 / 写 控制 信号 。 一 次 字 的 谈 / 写 操作 一 般 在 一 个 总 线 周 期 内 完成 。 

2) 块 传 送 操 作 

块 传送 又 称 为 狮 发 式 传送 。 每 次 完成 一 个 数据 块 的 传输 ,每 次 传输 主 设备 只 需 给 出 数 
据 块 的 起 始 地 址 ,然后 对 固定 块 长 度 的 数据 一 个 接 一 个 地 读 出 或 写 人 ,下 到 一 个 数据 块 全 部 
传输 完成 。 

3) 写 后 读 . 读 后 写 操作 

每 次 操作 只 给 出 地 址 一 次 ,然后 对 同一 地 址 单元 的 内 容 或 进行 “ 先 写 后 读 ? 操 作 ,或 进行 
“ 读 后 写 ”操作 。“ 先 写 后 读 ” 操 作 主 要 用 于 对 如 存储 右 的 校 验 ,即将 一 个 数据 先 写 人 某 一 地 
址 单元 ,然后 读 出 比较 , 据 此 判断 存储 单元 是 否 存在 故障 。“ 读 后 写 ” 操 作用 于 多 道 程序 系统 
中 对 共享 存储 资源 的 保护 。 无 论 是 “ 先 写 后 读 ” 还 是 “ 读 后 写 ”, 整 个 操作 都 是 不 可 分 的 。 

4) 广播 操作 

总 线 传送 通 第 是 在 一 个 主 设备 和 一 个 从 设备 之 间 进 行 ,但 有 些 总 线 允 许 一 个 主 设备 同 

时 对 多 个 从 设备 进 行 写 操作 ,这 种 操作 称 为 广播 。 


6.3 ”总线 标准 及 举例 


本 慷 自 先 介 绍 忆 线 标准 包含 了 哪些 方面 的 内 容 , 然 后 举 两 个 总 线 标准 
在 现代 机 咒 中 总 线 的 配置 方式 。 


6.3.1 总 线 标准 
不 同 厂家 生产 的 部 件 或 设备 可 以 通过 同一 总 线 互 连 ,例如 同一 厂家 生产 的 显卡 可 以 插 


接 在 不 同 厂家 生产 的 计算 机 主机 板 上 ,而 同一 厂 象 生产 的 机 禹 也 可 以 持 接 不 同 厂家 生产 的 


显卡 。 之 所 以 这 样 ,是 因为 这 些 厂家 生产 的 机 器 中 的 1/O 插 模 和 显卡 都 遵循 了 同一 个 系统 
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总 线 标 准 是 指 芯 片 之 间 部件 之 间 , 插 板 之 间或 系统 之 间 通 过 总 线 进行 连接 和 通信 时 应 
遵守 的 一 些 协 议 与 规范 。 

通常 一 个 总 线 标准 应 定义 以 下 几 个 方面 的 特性 (规范 ) 。 

(1) 物理 特性 : 指 总 线 的 物理 连接 方式 ,包括 总 线 信 号 
形状 和 物理 尺寸 及 引 脚 线 的 排列 方式 等 。 

(2) 电气 特性 : 定义 每 一 条 线 上 信号 的 传递 方 同 及 有 效 电 平 范围 。 例 如 ,TTL 高 电 平 
为 3.6 一 5V, 低 电 平 为 0 一 2.4V 等 。 大 在 总 线 上 用 高 电 平 表示 “1”、 低 电 平 表示 “0”, 则 当 某 
一 部 件 需 要 通过 某 条 信号 线 向 另 一 部 件 传递 “1” 时 ,只 需 将 这 条 线 电 奈 值 置 为 3.6 一 5V 即 
可 ,而 接收 的 一 方 也 同样 使 用 的 是 TTL 电 平 。 

(3) 功能 特性 : 描述 总 线 中 每 一 条 线 的 功能 ,如 定义 地 址 线 、 数 据 线 和 各 种 控制 及 状态 
信号 线 。 对 系统 总 线 而 言 ,地 址 线 的 条 数 决 定 了 CPU 能 访问 的 存储 需 的 最 大 物理 空间 的 
大 小 ; 数据 线 的 条 数 决 定 了 CPU 与 存储 髓 及 设备 间 能 够 并 行 传输 的 数据 的 位 数 ; 而 控制 
言 号 则 根据 CPU 功能 的 不 同 而 有 所 不 同 。 一 般 来 讲 , 总 线 中 所 包含 的 信号 有 以 下 几 种 。 

QO CPU 访 存 . 访 I/O 的 读 写 控制 信号; 

实现 中 断 机 制 的 中 断 控 制 信号 ; 

对 其 他 主 设 备 请 求 总 线 的 总 线 仲裁 信号 ; 

反映 设备 状态 的 状态 信号 ; 

通信 同步 、 复 位 .休眠 等 信和 号 ; 

电源 和 地 线 ， 

(4) 时 间 特 性 : 即 定 义 信 号 线 之 间 的 时 序 关 系 。 机 器 中 所 有 部 件 的 操作 都 是 在 CPU 
产生 的 各 种 控制 信和 号 的 控制 下 完成 的 ,这 些 控 制 信和 号 必须 遵循 一 定 的 时 序 关系 。 换 句 话 说， 
一 个 机 器 系统 的 设计 正确 与 否 ,一 方面 取决 于 逻辑 关系 设计 的 正确 与 否 , 另 一 方面 还 取决 于 
时 序 关 系 设计 的 正确 与 否 。 


6.3.2 |SA 总 经 


条 数 ,总线 的 插头 、 插 座 的 


1981 年 IBM 公司 推出 了 基于 8088 CPU 的 IBM PC 微型 计算 机 ,其 上 使 用 的 是 一 个 62 
条 引 脚 的 XT 总 线 。1984 年 IBM 公司 又 推出 了 基于 80286 CPU 的 IBM PC/AT, 其 上 使 用 
的 总 线 是 AT 总 线 。AT 总 线 是 在 原 XT 总 线 的 基础 上 扩充 而 来 的 ,总 线 引 脚 在 原来 62 条 
的 基础 上 又 增加 了 36 条 ,从 而 扩充 到 98 条 引 脚 。AT 总线 具 有 16 位 数据 宽度 ,最 高 工作 
频率 为 8MHz, 数 据 传 输 速 率 达 到 16MB/s ,地 址 线 24 条 ,可 寻访 16MB 内 存单 元 。1987 年 
IEEE 以 XT/AT 总 线 为 蓝本 ,定义 了 工业 标准 体系 结构 (Industry Standard Architecture， 
ISA) ,其 中 原 XT 总 线 定 义 为 8 位 JISA 忆 线 , 原 AT 总 线 定 义 为 16 位 JISA 总 线 。ISA 总 线 
在 微型 计算 机 上 使 用 了 二 十 多 年 ,直到 在 以 P4 为 CPU 的 主板 上 很 少 使 用 。 图 6-9 给 出 了 
一 个 ISA 总 线 在 机 器 主板 上 的 分 布 情况 图 。 

ISA 总 线 具 有 很 强 的 CPU 相关 性 特征 ,也 就 是 说 ,ISA 是 针对 某 一 CPU 而 专门 设计 
的 ,其 中 8 位 ISA 是 针对 8088 CPU 设计 的 ,而 16 位 ISA 是 针对 80286 CPU 设计 的 。 总 线 
的 引 肢 信号 可 以 看 成 CPU 引 脚 的 延伸 。 例 如 62 线 的 ISA 总 线 中 包含 了 与 8088 CPU 5 引 脚 
相同 的 20 条 地 址 线 、8 条 数据 线 和 读 / 写 .中断 请 求 , 总线 请 求 、 复 位 及 电源 .地 线 等 。 而 16 
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位 ISA 增加 的 36 线 包 括 与 80286 CPU 相 匹 配 的 8 条 数 


据 线 、4 条 地 址 线 以 及 新 增 中 断 请 


ISA 总 线 插 档 


XT 总 线 的 
623| 脚 插 档 


AT 总 线 新 增 的 
365| 脚 插 楼 


到 6-9 ISA 总 线 


ISA 总 线 在 设计 时 采用 的 是 单 总 线 纺 构 , 主 仓 和 所 有 : 
线 与 CPU 连接 。 


洽 入 输出 接口 通过 单条 的 ISA 总 


6.3.3 PCI 总 


随 着 Windows 图 形 用 户 界 面 的 迅速 发 展 , 以 及 多 媒体 技术 的 广泛 应 用 ,要 求 系统 具 
高 速 图 形 处 理 和 LI/O 否 吐 能 力 。 为 了 适应 计算 机 的 这 种 发 展 要 求 ,Intel 公司 首先 提出 了 
PCI(Peripheral Component Interconnect) 总 线 的 概念 。 之 后 Intel 联合 IBM、Compaq、 
AST、HP、Apple、NCR、DEC 等 一 百 多 家 公 \ 司 共同 开发 站 六 线 ， 并 于 1993 年 推出 了 PCI 总 线 
标准 。 目 前 PCI 已 成 为 一 种 新 的 电线 标准 ,广泛 用 于 微机 .工作 站 以 及 便携 式 计算 机 中 ，。 


1. PCI 总 线 的 特点 


有 


PCI 总 线 主要 具有 以 下 一 些 特点 。 

1) 数据 传输 率 高 

PCI 的 数据 总 线 览 度 为 32 位 ， ln 64 位 。 它 以 33. 3MHz 或 66. 6MHz 的 时 : 
频率 工作 ,车 采用 32 位 数据 总 线 ,数据 速率 可 达 133MB/s; 而 米 用 64 位 数据 总 线 , 则 
最 高 的 数据 传输 速率 可 达 266MB/s。 

2) 支持 狮 发 传输 

通常 的 数据 传输 是 先 输出 地 址 后 进行 数据 操作 , 即 村 所 要 八 输 数据 的 地 址 征 连 缕 的 ， 三 
次 也 要 有 输出 和 建立 地 址 的 阶段 。 而 PCI 支持 狸 发 数据 传输 周期 ,i 冯 周 期 在 一 个 地 址 相位 
(phase) 后 可 跟 者 干 个 数据 相位 。 这 总 妹 着 传输 从 菜 一 个 地 址 开始 后 ， ,可 以 连续 对 数据 进行 
操作 , 而 每 次 的 操作 数 地 址 是 目 动 加 1 形成 的 。 显 然 , 这 减少 了 无 请 的 地 址 操作 ,加 快 了 传 
输 速 度 。 这 种 传输 方式 对 使 用 高 性 能 图 形 设 备 尤 为 重要 。 

3) 支持 多 主 设 备 

一 条 PCI 总 线 上 可 以 有 多 个 主 设备 ,各 个 主 设 备 通过 总 线 仲裁 苋 争 总 线 控制 权 ， 
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相 比 之 下 ,在 ISA 总 线 系统 中 ,DMA 控制 项 和 CPU 对 总 线 的 争 用 是 不 平等 的 ,DMA 控制 
器 采用 “周期 窃取 ”法 向 CPU 申请 总 线 , 得 到 CPU 的 允许 后 才能 使 用 总 线 。 而 PCI 总 线 专 
门 设 有 总 线 占用 请 求 和 总 线 占 用 允许 信号 ,各 个 主 设备 平等 竞争 总 线 。 

4) 独立 于 处 理 责 

传统 的 系统 总 线 ( 如 ISA 总 线 ) 实 际 上 是 CPU 引 脚 信号 的 延伸 或 再 驱动 ,而 PCI 总 线 
一 种 独特 的 中 间 绥 冲 各 方 式 独 立 于 处 理 各 ,并 将 CPU 了 于 系统 与 外 围 设 备 分 开 。 一 般 来 
说 ,在 CPU 总 线 上 增加 更 多 的 设备 或 部 件 , 会 降低 系统 性 能 和 可 徘 程 度 。 而 有 了 这 种 缓冲 
髓 的 设计 方式 ,用 户 可 随意 增添 外 围 设 备 ,而 不 必 担 心 会 导致 系统 性 能 的 下 降 。 这 种 独立 于 
CPU 的 总 线 结 构 还 可 保证 外 围 设备 互 连 系 统 的 设计 不 会 因 人 处 理 兹 拉 术 的 变化 而 变 得 过 时 ，。 

5) 支持 即 插 即 用 

所 谓 即 捕 即 用 (Plug and Play) ,是 指 在 新 的 接口 卡 插入 PCI 总 线 捅 槽 时 ,系统 能 上 自动 识 
别 并 小 入 相应 的 设备 驱动 程序 ,因而 立即 可 以 使 用 。 即 插 即 用 功能 使 用 户 在 安装 接口 卡 时 
不 必 再 拨 开 关 或 设 跳 线 , 也 不 会 因 设 置 有 错 而 使 接口 卡 或 系统 无 法 正常 工作 。 即 插 即 用 的 
便 件 基础 是 每 个 PCI 接口 卡 (PCI 设备 ) 中 的 256 个 字 市 的 配置 寄存 各 。 在 操作 系统 局 动 时 
或 在 PCI 接口 卡 刚 接 入 时 PCI 总 线 驱 动 程序 要 访问 这 些 寄 存 散 ,以便 对 其 初始 化 ,并 闭 人 
相应 的 设备 驱动 程序 。 

6) 适用 于 多 种 机 型 

PCI 总 线 适 用 于 各 种 类 型 的 计算 机 系统 ,如 台式 计算 机 ,便携 式 计算 机 及 服务 熏 等 。 

通过 支持 3. 3V 的 电源 环境 ,PCI 总 线 可 应 用 于 便携 式 计算 机 中 。 在 服务 带 环 境 下 , 往 
往 要 求 能 连接 较 多 的 外 围 设备 ,而 PCI 总 线 规则 规定 一 个 计算 机 系统 中 可 同时 使 用 多 条 
PCI 总 线 , 这 又 使 得 PCI 总 线 非常 适合 应 用 于 服务 右 中 、. 


2. PCI 总 线 的 系统 结构 


PCI 总 线 属 于 局 部 总 线 , 它 文 持 多 总 线 绪 构 , 人 允许 PCI 总 线 和 CPU 总 线 及 其 他 总 线 在 
同一 个 机 各 系统 中 并 存 。 它 的 这 一 特点 使 得 灯 用 PCI 总 线 的 机 天 系统 的 设计 非常 灵活 ,一 
方面 可 以 通过 PCI 总 线 连 接 各 种 PCI 设备 , 男 一 方面 可 以 通过 其 他 总 线 连接 一 些 非 PCI 设 
备 。 图 6-10 给 出 了 一 个 采用 PCI 总 线 的 机 器 系统 的 结构 图 。 

从 图 6-10 中 可 以 看 出 ,连接 在 CPU 总 线 上 的 cache 和 主 存 系统 经 过 一 个 桥 与 PCI 总 
线 相 连 。 此 桥 电 路 提供 了 一 个 低 延 迟 的 访问 通路 ,从 而 使 CPU 能 够 直接 访问 通过 它 映射 
于 存储 靛 空间 或 I/O 空间 的 PCI 设备 ; 也 提供 了 能 使 PCI 主 设备 下 接 访 问 主 存 的 高 速 通 
路 。 该 桥 电 路 还 能 提供 数据 缓冲 功能 ,以 使 处 理 器 与 PCI 总 线 上 的 设备 并 行 工 作 而 不 必 相 
互 等 每 。 男 外 , 桥 电 路 可 使 PCI 总 线 的 操作 与 CPU 局 部 总 线 分 开 , 以 免 相 互 影响 ,实现 了 

扩展 总 线 桥 电 路 的 设置 是 为 了 能 在 PCI 总 线 上 引出 一 条 传统 的 标准 1/O 扩展 总 线 , 如 
ISA、EISA 或 MCA 总 线 , 从 而 可 继续 使 用 原 有 的 IO 设备 ,以 增加 PCI 总 线 的 碌 容 性 和 选 
择 范 围 。 通 常 ,典型 的 PCI 局 部 总 线 最 多 文 持 三 个 捅 梭 。 如 果 一 个 系统 中 要 连接 多 个 PCI 
设备 ,可 通过 增加 桥 电路 的 方式 形成 多 条 PCI 局 部 总 线 。 在 一 个 系统 中 最 多 可 有 256 条 
PCI 局 部 总 线 。 通 常 , 把 连接 CPU 总 线 与 PCI 总 线 的 桥 电路 称 为 主 桥 或 宿主 桥 (Host 
Bridge) ,连接 PCI 总 线 与 PCI 总 线 的 桥 电 路 称 为 PCI-PCI 桥 ,连接 PCI 总 线 与 其 他 总 线 的 
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| | Pct 


低速 总 线 | PCI 总 线 、 
低 运 低 对 本 和 


图 6-10 ”PCI 总 线 结构 


桥 电路 称 为 PCI 扩展 桥 ， 
3. PCI 总 线 的 信 与 定义 


在 一 个 PCI 系统 中 ,总 线 信 号 通 币 分 为 必 备 和 可 选 两 大 类 。 如 采 只 作为 从 设备 , 则 至 
少 需 要 47 根 信号 线 ; 和 作为 主 设备 , 则 需要 49 根 信 号 线 。 另 外 还 有 可 选 信 号 线 51 条 , 主 
要 用 于 64 位 扩展 .中断 请 求 .高 速 缓存 文 持 等 。PCI 信号 线 总 数 为 120 条 (包括 电源 、 地、 保 
留 引 脚 等 )。PCI 总 线 信 号 按 功 能 分 组 的 表示 如 图 6-11 所 示 。 其 中 信号 名 称 后 面 有 ” 井 ”号 
表示 低 电 平 有 效 ,否则 表示 高 电 平 有 效 ; 对 于 有 两 种 意义 的 信号 (如 C/BEL0j#), 低 电 平 时 
表示 有 ”“ 井 ? 写 的 信号 ( 例 中 的 BELOj) 起 作用 ,高 电 平 时 


表 示 没 有 ”" 井 ? 号 的 信号 ( 例 中 的 C) 
起 作用 。“# ”相当 于 通常 表示 中 的 上 横 杠 。 
(1) 系统 信和 号。 
CLK: 输入 ,系统 时 钟 信 号 ,为 所 有 PCI 传输 提供 时 序 , 对 于 所 有 的 PCI 设备 部 是 输入 
信号 。 其 频率 最 高 可 达 33MHz/66MHz, 这 一 频率 也 称 为 PCI 的 工作 频率 。 
RST#: 输入 ,复位 信号 ,用 于 将 所 有 PCI 专用 的 寄存 右 、 定 序 絮 和 信号 设置 为 初始 


(2) 地 址 和 数据 信和 号 。 
ADL31-0]: 这 是 一 组 双 辐 三 态 的 32 位 地 址 .数据 的 复 用 信号 。PCI 总 线 上 地 址 和 数据 
的 传输 必须 在 FRAME# 有效期 间 进行 ,在 FRAME# 有效 时 的 第 1 个 时 钟 ,AD[31-00] 上 
的 信号 为 地 址 信号 , 称 为 地 址 期 ; 当 IRDY# 和 TRDY# 同时 有 效 时 ,AD[31-00] 上 的 信号 
为 数据 信号 , 称 为 数据 期 。 一 个 PCI 总 线 传输 周期 包含 一 个 地 址 期 和 接 看 的 一 个 或 多 个 数 
据 期 。 

C/BEL3-0j]# : 总 线 命 令 和 字 节 人 允许 复 用 信号 , 双 回 三 态 。 在 地 址 期 ,这 4 条 线 上 传输 
的 是 总 线 命令 ; 在 数据 期 ,它们 传输 的 是 字 方 允许 信号 ,用 来 指定 在 数据 期 ADL31-00] 线 上 
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必 备 信和 与 可 迁 信 和 与 
ADT31-0] AD[63-32] 
C/BE[3-0]# JBE[7-4]# 
地 址 /数据 线 Em eS 
PAR PAR64 
REGQ64# 64 位 忆 线 打 展 线 
FRAME# ACK64# 
ee es 接口 控制 
IRDY# 及 
接口 控制 线 STOP# INTA# 
DEVSEL# [NTB# 
中 上 呆 控 和 填 必 芝 有 
IDSEL# PCI 设备 INTC# 站 断 控 制 线 
INTD# 
PERR# ee 
: 福 % 旺 直上 ed \ 
1 天 报 生 线 . SFRR# SmaNE cache 支 持 信和 号 
REQ# TDI 
仲 城 信 与 GNT# 1D0O 
一 一 边界 扫描 信号 
CLK T™S 
系统 信号 ”RST# TRST# 
图 6-11 PCI 总 线 信号 


数据 字 节 中 哪些 字 节 为 有 效 数据 。 
奇偶 校 验 信号 , 双 向 三 态 。 它 通过 ADL31-0] 和 C/BEL3-0j 进 行 奇偶 校 验 。 主 设 
备 在 地 址 周期 和 写 数 据 周 期 驱动 PAR, 从 设备 在 读 交 数据 周期 驱动 PAR 

(3) 接口 控制 信号 。 

FRAME# : 帧 周期 信号 , 双 回 三 态 , 由 主 设备 驱动 ,表示 一 次 总 线 传 输 的 开始 和 持续 时 
间 。 当 FRAME 并 有 将 时 ,预示 总 线 传 输 的 开始 ; 在 其 有 效 期 间 , 先 传 地 址 ,后 传 数 据 ; 当 
FRAME# 撤销 时 ,预示 总 线 传输 结束 ,并 在 IRDY 并 有 效 时 进行 最 后 一 个 数据 期 的 数据 
传送 。 

IRDY # ; 主 设 备 准备 好 信号 ,双向 三 态 。IRDY# 要 与 TRDY# 联合 使 用 , 当 两 者 同时 
有 效 时 ,数据 方 能 传输 ,否则 , 即 为 未 准 备 好 而 进入 等 每 周期 。 在 写 周 期 ,该 信号 有 效 时 , 表 
不 数据 已 由 主 设备 提交 到 ADL31-0j 线 上 ; 在 读 周 期 ,该 信号 有 效 时 ， 表示 主 设备 已 做 好 接 
收 数据 的 准备 。 

TRDY# : 从 设备 (被 选中 的 设备 ) 准 备 好 信号 , 双 同 三 态 。 同 样 TRDY # 要 与 IRDY# 
联合 使 用 ,只 有 了 两 者 同时 有 效 ,数据 才能 传输 。 

STOP# : 从 设备 要 求 主 设备 停止 当前 的 数据 传送 的 信号 ,双向 三 态 。 显 然 , 该 信号 应 
由 从 设备 发 出 。 

LOCK# : 锁定 信号 , 双 同 三 态 。 当 对 一 个 设备 进行 可 能 需要 多 个 总 线 传输 周期 才能 
完成 的 操作 时 ,使 用 锁定 信号 CLK , 进 和 了 独占 性 访问 。 例 如 , 某 一 设备 种 


fF 有 目 己 的 存储 全 ， 
那么 它 必 需 能 进行 锁定 ,以 便 实 现 对 该 存储 甫 的 完全 独占 性 访问 。 也 就 是 说 ,对 此 设备 的 探 
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作 是 排他 性 的 。 

IDSEL: 输入 ,初始 化 设备 选择 信和 号。 在 参数 配置 读 / 写 传输 期 间 ,用 作 片 选 信号 。 

DEVSEL# S/T/S: 设备 选择 信号 , 双 辐 三 态 。 该 信号 由 从 设备 在 识别 处 地 址 时 发 出 ， 
当 它 有 效 时 ,说 明 总 线 上 有 某 处 的 某 一 设备 已 被 选中 ,并 作为 当前 访问 的 从 设备 。 

(4) 仲裁 信号 (只 用 于 总 线 主 控 毅 ) 。 

REQ# : 总 线 占 用 请 求 信 号 , 双 回 三 仿 。 该 信号 有 效 表 了 明 豫 动 它 的 设备 要 求 使 用 总 线 。 
它 是 一 个 点 到 点 的 信号 线 ,任何 主 设备 都 有 它 自 己 的 REQ# 信 号。 

GNT#: 总 线 占用 允许 信号 , 双 同 三 态 。 该 信号 有 效 , 表 示 申 请 占用 总 线 的 设备 的 请 求 

(5) 错误 报告 信和 号。 

PERR# : 数据 奇偶 校 验 错误 报告 信号 , 双 回 三 态 。 一 个 设备 只 有 在 啊 应 设备 选择 信和 号 
(DEVSEL# ) 和 完成 数据 期 之 后 ,才能 报告 一 个 PERR#。 

SERR# : 源 极 开路 信号 , 低 电 平 有 效 。 系 统 错误 报告 信号 ,用 作 报 告 地 址 奇偶 错 \ 特 殊 
命令 序列 中 的 数据 奇偶 错 , 以 及 其 他 可 能 引起 灾难 性 后 条 的 系统 错误 。 它 可 由 任何 设备 

(6) 中 断 信 和 号。 

INTx 井 : 源 极 开路 信号 , 电 平 触发 , 低 电 平 有 效 的 中 汤 请 求 信 与 。 此 类 信号 的 建立 与 
撤销 与 时 钟 不 同步 。 对 于 单 功 能 设备 ,只 有 一 条 中 断 线 ,而 多 功能 设备 最 多 可 有 4 条 中 断 
线 。 在 前 一 种 情况 下 ,只 能 使 用 INTA# ,其 他 3 条 中 断 线 没有 意义 。 所 谓 多 功能 的 设备 是 
指 将 几 个 相互 独立 的 功能 集中 在 一 个 设备 中 。PCI 总 线 中 共有 4 条 中 断 请 求 线 ,分 别 是 
INTA# JINTB 上 # JINTC# 和 INTD# , 均 为 漏 极 开路 信号 ,其 中 后 三 个 只 能 用 于 多 功能 设 
备 。 一 个 多 功能 设备 上 的 任何 功能 都 可 对 应 于 四 条 中 断 请 求 线 中 的 任何 一 条 , 即 各 功能 与 
中 断 请 求 线 之 间 的 对 应 关系 是 任意 的 ,没有 附加 限制 。 两 者 的 最 终 对 应 关系 由 中 断 引 脚 寄 
存 器 定义 ,因而 具有 很 大 的 灵活 性 。 如 果 一 个 设备 要 实现 一 个 中 断 , 就 定义 为 INTA 直 ; 要 
实现 两 个 中 断 , 则 定义 为 INTA# 和 INTB# ,其 他 情况 以 此 类 推 。 对 于 多 功能 设备 ,可 以 多 
个 功能 公用 同一 条 中 上 断 请求 线 ,或 者 各 目 占 一 条 ,或 者 是 两 种 情况 的 组 合 ; 而 单 功能 设备 ， 
只 能 使 用 一 条 中 断 请 求 线 。 

(7) cache 文 持 信 号 。 

为 了 使 具有 缓存 功能 的 PCI 存储 器 能 够 和 全 写 式 (Write-through) 或 回 写 式 (Wirite- 
back) 的 cache 操作 相配 合 ,PCI 总 线 设 置 了 两 个 高 速 缓冲 支持 信号 。 

SBO# : 舌 视 返回 信号 , 双 同 低 电 平 有 效 。 当 该 信号 有 效 时 ,表示 命中 了 一 个 修改 行 。 

SDONE# : 查询 完成 信号 , 双 同 低 电 平 有 效 。 当 它 有 效 时 ,表示 查询 已 经 完成 ; 反之 ， 
查询 仍 在 进行 中 。 

(8) 64 位 扩展 信号。 

REQ64 井 : 64 位 传输 请 求 信号 , 双 同 三 态 , 低 电 平 有 效 。 
由 主 设备 驱动 ,时 厅 与 FRAME# 相同 。 

ACK64 划 : 64 位 传输 啊 应 信号 , 双 同 三 态 , 低 电 平 有 效 , 由 从 设备 驱动 。 该 信号 有 效 表 
明 从 设备 将 局 用 64 位 通道 传输 数据 ,其 时 序 与 DEVSEL# 相同。 

ADL63 一 32|: 扩展 的 32 位 地 址 和 数据 复 用 线 。 


该 信号 用 于 64 位 数据 传输 ， 
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C/VBEL7 一 4]# : 高 32 位 总 线 命令 和 字 节 允许 信号 。 

PAR64; 高 32 位 奇偶 校 验 信号 ,是 AD[63 一 32] 和 CVBEL7 一 4] 的 校 验 位 。 

PCI 总 线 使 用 124 线 总 线 插 权 ,用 于 连接 总 线 板 卡 , 板 卡 的 总 线 连接 涉 上 每 边 各 有 62 
个 引线 。 扩 充 到 64 位 时 ,总 线 插 槽 需 增 加 64 线 , 变 成 188 线 。 相 应 地 , 板 卡 的 总 线 连 接头 
上 每 边 变 成 94 线 。 限 于 篇 幅 , 这 里 不 列举 PCI 总 线 搬 槽 及 板 卡 的 全 部 188 个 引 脚 ,读者 如 
有 需要 ,可 查阅 有 关 资 料 。 


6.3.4 PCI-X 总 丝 


PCI-X 是 由 IBM、HP、Compaq 提出 来 的 , 它 是 并 行 接 口 , 是 PCI 的 修正 ,也 就 是 菩 容 
PCI。PCI-X 是 在 增加 了 电源 管理 功能 和 热 插 拔 技 术 的 PCI V2.2 版 本 的 基础 上 ,将 PCI 的 
总 市 锅 由 133MB/s 增 至 1.066GB/s。 同 时 它 还 采用 了 分 离 事 务 即 多 任务 的 设计 ,人 允许 一 个 
正在 问 某 个 目标 设备 请 求 数据 的 设备 ,在 目标 设备 未 准备 好 之 前 处 理 其 他 任何 事情 ; 而 在 
目前 的 PCI 体系 中 ,设备 在 完成 一 次 请 求 之 前 不 能 理会 任何 事情 ,此 时 的 总 线 时 钟 周期 都 
被 日 日 浪费 挥 了 。 同 时 PCI-X 还 允许 把 没有 准备 好 发 送 数据 的 设备 从 总 线 上 移 走 ,这 样 总 
线 市 宽 可 以 被 其 他 事务 使 用 ,使 总 线 的 利用 率 大 幅 上 升 。 所 以 ,在 相同 的 频率 下 ,PCLEX 将 能 
提供 比 PCI 高 14%~35% 的 性 能 。PCI-X 还 采用 了 与 IA-64 相同 的 128b 标准 尺寸 数据 块 设 
计 , 使 通过 总 线 的 数据 块 大 小 相同 ,这 样 就 提供 了 更 多 的 流水 线 机 制 ,改善 了 处 理 硕 的 管理 。 

PCI-X 目前 分 为 66MHz 、 100MHz 和 133MHz 三 个 版 本 。 工 作 于 66MHz 的 PCI-X 控 
制 器 将 能 访问 最 多 4 个 PCLX 设 备 , 当 然 ,: 如 果 增 加 PCLX 至 PCLX 的 桥接 芯片 ,那么 可 以 
支持 更 多 的 设备 。66MHz PCLX 拥有 533MB/s 的 带宽 。PCLX 总 线 是 共用 的 , 有 
66MHz、100MHz 和 133MHz 三 种 ,100MHz PCLX 的 设备 均 工 作 于 100MHz 下 ,此 时 PCI- 
X 总 线 只 能 管理 最 多 两 个 PCLX 设备 ,在 64b 总 线 和 100MHz 频率 下 ,拥有 800MB/s 的 带 
宽 。 最 豪华 的 133MHz PCLX 工作 于 133MHz, 将 能 提供 惊人 的 1066MB/s 带宽 。 


6.3.5 PCI-Express 总 线 


PCI-Express( 简 称 PCI-E) 是 最 新 的 总 线 和 接口 标准 , 它 原来 的 名 称 3GIO, 是 由 英特尔 
提出 的 。 英 特 尔 的 意思 是 它 代 表 看 下 一 代 IO 接口 标准 。 交 由 PCI-SIG(PCI 特殊 兴趣 组 
织 ) 认 证 发 布 后 才 改 名 为 PCI-Express。 这 个 新 标准 将 全 面 取代 现行 的 PCI 和 AGP, 最 终 实 
现 总 线 标准 的 统一 。 它 的 主要 优势 就 是 数据 传输 速率 高 ,目前 最 高 可 达到 10GB/s 以 上 。 

PCI-Express 市 锅 ( 双 回 传 输 模 式 ): 

(1) 1 lane-xl: 500MPB,/s, 

(2) 4 lane-x4:， 2GB/s (2000MB/s) 。 

(3) 8 lane-x8:. 4GB/s (4000MB,/s), 

(4) 16 lane-xl6. 8GB/s (8000MB,/s), 

PCIE 总 线 是 一 种 完全 不 同 于 过 去 PCI 总 线 的 一 种 全 新 总 线 规范 ,与 PCI 总 线 共 部 并 
行 染 构 相 比 ,PCI-Express 总 线 是 一 种 点 对 点 串 行 连接 的 设备 连接 方式 ,点 对 点 意味 看 每 一 
个 PCI Express 设备 都 拥有 目 己 独立 的 数据 连接 ,各 个 设备 之 间 并 发 的 数据 传输 互 不 影 啊 ， 
而 对 于 过 去 PCI 那 种 共享 总 线 方式 ,PCI 总 线 上 只 能 有 一 个 设备 进行 通信 ,一 旦 PCI 和 总 线 上 
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挂 接 的 设备 增多 ,每 个 设备 的 实际 传输 速率 就 会 下 降 , 性 能 得 不 到 保证 。 现 在 ,PCI-Express 
以 点 对 点 的 方式 处 理 通信 ,每 个 设备 在 要 求 传输 数据 的 时 候 各 自 建立 自己 的 传输 通道 ,对 于 
其 他 设备 这 个 通道 是 封闭 的 ,这 样 的 操作 保证 了 通道 的 专 有 性 ,避免 其 他 设备 的 干扰 。 


1. 南北 桥 结构 
计算 机 采用 的 就 是 多 总 线 结构 ,如 图 6-12 所 示 是 其 主板 总 线 结构 图 。 
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图 6-12 ”现代 微机 主板 总 线 结 构 示 意 医 


其 中 ,北桥 芯片 (North Bridge) 是 主板 忆 片 组 中 起 主导 作用 的 最 重要 的 组 成 部 分 ,也 称 
为 主 桥 (Host Bridge)。 一 般 来 说 , 必 片 组 的 名 称 就 是 以 北桥 忌 片 的 名 称 来 命名 的 ,例如 
Intel 845E 世 片 组 的 北桥 让 片 是 82845E ,Intel 875P 世 片 组 的 北桥 芯片 是 82875P ,等 等 ， 北 
桥 芯片 负责 与 CPU 的 联系 并 控制 内 存 ,.AGP 数据 等 在 北桥 内 部 传输 ,提供 对 CPU 的 类 型 
和 系统 的 前 端 总 线 频率 .内存 的 类 型 (SDRAM,DDR SDRAM 以 及 RDRAM 等 ) 和 最 
大 容量 `.AGP 插 模 、ECC 纠 错 等 的 支持 ,整合 型 芯片 组 的 北桥 芯片 还 集成 了 显示 核心 。 北 
酉 心 : 片 就 是 主板 上 离 CPU 最 近 的 芯片 ,这 主要 是 考虑 到 北桥 芯片 与 处 器 之 间 的 通信 最 
密切 ,为 了 提高 通信 性 能 而 缩短 传输 距离 。 因 为 北桥 芯片 的 主要 功能 之 一 是 控制 内 存 , 而 内 
存 标 准 与 处 理 需 一 样 变 化 比较 频 营 ,所 以 不 同 忌 片 组 中 北桥 芯片 是 肯定 不 同 的 ,当然 这 并 不 
是 说 所 采用 的 内 存 技术 就 完全 不 一 样 ,而 是 不 同 的 芯片 组 北桥 芯片 间 可 能 存在 一 定 的 差异 。 

南 桥 芯 片 (South Bridge) 是 主板 芯片 组 的 另 一 个 重要 的 组 成 部 分 ,一 般 位 于 主板 上 离 
CPU 捕 槽 较 远 的 下 方 ,PCI 捕 槽 的 附近 ,这 种 布局 是 考虑 到 它 所 连接 的 IO 总 线 较 多 , 离 人 处 
理 器 远 一 点 有 利于 布线 。 南 桥 芯 片 不 与 处 理 需 直接 相连 ,而 是 通过 一 定 的 方式 (不 同 厂 商 各 


种 忌 片 组 有 所 不 同 ) 与 北桥 芯片 相连 。 南 桥 心 片 负责 I/O 总 线 之 间 的 通信 ,如 PCI 总 线 、 
USB、_LAN、ATA、 SATA .音频 控制 怖 、 键 盘 探 制 舌 、 实 时 时 钟 控制 凯 、 高 级 电源 管理 等 ,这 
些 技术 一 般 相 对 来 说 比较 稳定 ,所 以 不 同 芯 片 组 中 可 能 南 桥 世 片 是 一 样 的 ,不 同 的 只 是 北桥 
忆 片 。 所 以 现在 主板 芯片 组 中 北桥 芯片 的 数量 要 远 远 多 于 南 桥 忆 片 。 例 如 早期 英特尔 不 同 
架构 的 芯片 组 Socket 7 的 430TX 和 Slot 1 的 440LX 其 南 桥 芯片 都 采用 82317AB, 而 近 两 
年 的 必 片 组 845E/845G/845GE/845PE 等 配置 都 采用 ICH4 南 桥 世 片 , 但 也 能 搭配 ICH2 
南 桥 忆 片 。 更 有 甚 者 ,有 些 主 板 厂 家 生产 的 少数 产品 采用 的 南北 桥 是 不 同 世 片 组 公司 的 产 
品 。 南 桥 忆 片 的 发 展 方 癌 主 要 是 集成 更 多 的 功能 ,如 网 卡 、RAID IEEE 1394 及 Wi-Fi 无 线 

传统 的 再 北桥 结构 是 通过 PCI 总 线 来 连接 的 ,第 用 的 PCI 总 线 是 33. 3MHz 工作 频率 ， 
32b 传输 位 宽 , 所 以 理论 最 高 数据 传输 率 仅 为 133MB/s。 由 于 PCI 总 线 的 共享 性 , 当 了 于 系 
统 及 其 他 周边 设备 传输 速率 不 断 提高 以 后 ,主板 南北 桥 之 间 偏 低 的 数据 传输 率 就 之 渐 成 为 
影响 系统 整体 性 能 发 挥 的 翔 贷 。 因 此 ,从 现 特 尔 1810 开始 , 心 片 组 三 商都 开始 寻求 一 种 能 
够 提高 南北 桥 连 接 市 宽 的 解决 方案 。 


2. 加 速 中 心 结 构 


加 速 中 心 结 构 (Accelerated Hub Architecture,AHA) 首 次 出 现在 英特尔 的 著名 整合 必 
片 组 1810 中 。 在 i810 尾 片 组 中 ,英特尔 一 改过 去 经 典 的 南北 桥 殿 构 , 采 用 了 新 的 AHA 结 
构 。AHA 结构 由 相当 于 传统 北桥 芯片 的 图 形 / 存 储 器 控制 中 心 (Graphics && Memory 
Controller Hub,GMCH) 和 相当 于 传统 南 桥 世 有 片 的 LO 控制 中 心 (I/O Controller Huhb， 
ICH) ,以 及 新 增 的 固件 控制 器 (Firmware Hub,FWH), 它 相当 于 传统 体系 结构 中 的 BIOS 
ROM, 共 三 块 芯片 构成 。 

在 这 种 新 的 AHA 结构 中 ,两 块 必 片 不 是 通过 PCI 总 线 进 行 连接 ,而 是 利用 能 提供 两 倍 
于 PCI 总 线 市 蜗 的 专用 总 线 连 接 的 。 这 样 ,每 种 设备 包括 PCI 总 线 部 可 以 与 CPU 直接 通 
言 , Intel 810 心 片 组 中 的 内 存 控制 项 和 图 形 控 制 着 也 可 以 使 用 一 条 8b 的 133MHz 2 六 模 
式 ” 总 线 ,使 得 数据 带宽 达到 266MB/s, 它 的 后 续 世 片 组 也 大 多 采用 AHA 结构 。 

这 种 体系 本 质 上 跟 南 北桥 结构 相差 不 大 , 它 主要 是 把 PCI 控制 部 分 从 北桥 中 剥离 出 来 
(北桥 成 为 GMCH), 由 ICH 负责 PCI 以 及 其 他 以 前 南 桥 负 责 的 功能 ,而 ICH 也 采用 了 加 
速 中 心 结构 ,在 图 形 卡 和 内 存 与 整合 的 AC'97 控制 器 .IDE 控制 器 、 双 USB 端口 和 PCI 附 
加 卡 之 间 建 立 一 个 直接 的 连接 。 由 于 AHA 结构 提供 了 每 秒 266MB 的 PCI 带 宽 , 这 使 得 JI 
0O 控制 项 和 内 存 控 制 融 之 间 可 以 传输 更 多 的 信息 ; 再 加 上 优化 了 仲裁 规则 ,系统 可 以 同时 
执行 更 多 的 线程 ,从 而 有 了 较为 明显 的 性 能 提升 。 在 GMCH 与 ICH 之 间 的 传输 速率 则 达 
到 了 8 位 133MHz DDR( 等 效 于 266MHz,266MB/s), 它 使 得 PCI 总 线 、`USB 总 线 以 及 IDE 
通道 与 系统 内 存 和 处 理 器 之 间 的 带宽 有 较 大 的 提高 。 


知识 拓展 


前 端 总 线 
前 端 总 线 的 英文 名 称 是 Front Side Bus, 通 常用 FSB 表示 ,这 个 名 称 是 由 AMD 公司 在 
推出 K7 CPU 时 提出 的 , 它 指 的 是 将 CPU 连接 到 北桥 芯片 的 总 线 。 北 桥 芯 片 负 责 联 系 内 
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存 、 显 卡 等 数据 吞吐 量 最 大 的 部 件 , 并 和 南 桥 芯片 连接 。CPU 就 是 通过 前 端 总 线 (FSB) 连 
接 到 北桥 芯片 ,进而 通过 北桥 芯片 和 内 存 、 显 卡 交换 数据 。 

前 端 总 线 是 CPU 和 外 界 交 换 数 据 的 主要 通道 ,因此 前 端 总 线 的 数据 传输 能 力 对 计算 
机 整体 性 能 影响 很 大 ,如 果 没 有 足够 快 的 前 端 总 线 , 再 强 的 CPU 也 不 能 明显 提高 计算 机 
的 整体 速度 。 数 据 传 输 的 最 大 带宽 取决 于 所 有 同时 传输 的 数据 的 宽度 和 传输 频率 , 即 数 
据 市 宽 二 (总 线 频 率 义 数据 位 宽 )/8。 目 前 PC 上 所 能 达到 的 前 端 总 线 频 率 有 266MHz、 
333MHz、400MHz、533MHz、800MHz 等 几 种 ,前 端 总 线 频率 越 大 ,代表 着 CPU 与 北桥 芯片 
之 间 的 数据 传输 能 力 越 大 ,更 能 充分 发 挥 出 CPU 的 功能 。 在 同等 条 件 下 ,前端 总 线 越 快 ， 
系统 性 能 越 好 。 

前 端 总 线 的 频率 与 计算 机 外 频 是 两 个 不 同 的 概念 ,通常 所 说 的 外 频 指 的 是 CPU 与 主 
板 连接 的 速度 ,这 个 概念 是 建立 在 数字 脉冲 信号 振荡 速度 基础 之 上 的 ,而 前 端 总 线 的 速度 指 
的 是 数据 传输 的 速度 ,也 就 是 说 ,100MHz 外 频 特 指数 字 脉 冲 信 号 在 每 秒 钟 振荡 一 亿 次 ; 而 
100MHz 前 端 总 线 指 的 是 每 秒 钟 CPU 可 接受 的 数据 传输 量 是 100MHz X 64b/8B/b 王 
800MPB,/s, 


交口 


计算 机 与 外 部 设备 之 间 除 了 通过 设备 适配器 经 系统 总 线 互 连 外 ,还 可 通过 一 些 标准 的 
外 部 总 线 连 接 。 一 般 来 讲 ,计算 机 主板 上 集成 了 一 些 篆 用 的 标准 外 部 总 线 接 口 , 如 USB 接 
口 .IEEE 1394 接口 ,SCSI 等 。 


6.4.1 JCS| 


SCSI 是 小 型 计算 机 系统 接口 (Small Computer System Interface) 的 贸 写 , 是 一 种 外 部 
总 线 接口 标准 。SCSI 是 由 美国 的 Shugart Associates 和 NCR 公司 在 1979 年 发 明 的 。 
Shugart Associates 是 当时 磁盘 驱动 右 的 主要 制造 厂商 ( 和 希捷 公司 前 亲身 ) ,而 NCR 也 曾经 在 
小 型 计算 机 市 场 中 扮演 重要 的 角色 。 这 个 接口 开始 的 名 字 为 SASI, 即 Shugart Associates 
Systems Interface,1982 年 4 月 美国 国家 标准 委员 会 ANSI 将 其 改名 为 SCSI, 使 其 有 一 个 更 
通用 的 名 字 。1986 年 6 月 ANSI 发布 了 SCSI-1 标准 ,从 此 真正 开始 了 SCSI 的 应 用 和 发 展 
历程 。 

SCSI 正如 其 名 字 所 表示 的 那样 ,最初 用 于 小 型 计算 机 系统 , 随 独 微型 计算 机 技术 的 发 
展 , 后 来 也 用 于 微机 系统 ,但 主要 应 用 于 对 性 能 要 求 较 高 或 专业 性 较 强 的 场合 ,如 网 络 服务 


1. SCSI 的 特点 


与 微型 计算 机 中 的 IDE 接口 相 比 ,SCSI 具 有 以 下 几 个 方面 的 特点 。 

1) 应 用 面 广 

SCSI 是 一 种 连接 主机 和 外 围 设备 的 接口 , 它 不 仅仅 用 于 连接 磁盘 驱动 器 、 磁 市 机 、 光 了 驱 
等 辅 存 设备 ,还 文 持 其 他 多 种 输入 输出 议 备 。 
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2) 适应 性 强 

SCSI 接口 适配器 (又 称 SCSI 控制 占 ) 中 包含 了 一 个 相当 于 小 型 CPU 功能 的 控制 逻辑 ， 
它 有 上 有 目 己 的 命令 集 和 缓冲 存储 关 。SCSI 的 命令 与 设备 和 主机 无 关 , 玉 用 命令 描述 块 (CDB) 的 
形式 由 主 设备 发 送 给 目标 设备 ,CDB 说 明了 操作 的 性 质 、 源 和 目的 数据 块 的 地 址 ,传送 的 块 
数 等 信息 。 无 论 主机 采用 什么 类 型 的 设备 级 接口 .设备 甚至 系统 总 线 结构 ,SCSI 总 线 都 有 
相同 的 物理 和 逻辑 特性 。 态 外 SCSI 接口 控制 锅 能 够 独立 完成 输入 输出 过 程 中 的 数据 组 
冲 数据 格式 转换 及 DMA 控制 等 ,从 而 可 以 减轻 CPU 的 负担 ,有 效 提高 CPU 的 利用 率 。 

3) 扩展 性 好 

SCSI 系统 可 以 是 一 个 主机 , 即 一 个 主 适 配 咒 和 一 个 外 设 控制 闫 最 简单 的 形式 ,也 可 以 
是 一 个 或 多 个 主机 与 多 个 外 设 控制 需 的 组 成 。SCSI 规定 系统 至 多 有 的 SCSI 设备 数目 ; 
SCSI 总线 数据 的 位 数 , 如 及 用 32 位 数据 总 线 , 则 至 多 有 32 个 SCSI 设备 。 而 微型 计算 机 上 


的 IDE 接口 最 多 只 能 连接 4 个 设备 。 因 此 ,SCSI 具有 民 好 的 可 扩展 性 。 
4) 六 所 六 


输 速 率 仅 为 5MB/s, 而 新 一 代 的 SCSI 标准 最 大 的 


但 < SCSI IDE 在 价格 方面 ,其 价位 高 出 许多 ， 而 且 在 使 用 方面 不 如 IDE 方便 。 目 前 ， 
SCSI 的 设计 正 瑚 着 支持 即 插 妈 用、 多 功能 化 及 网 络 化 的 方 回 发 展 。 


2. SCSI 家 族 


SCSI 有 多 种 版 本 ,但 作为 标准 来 说 ,主要 包括 三 种 : SCSI-1、SCSI-2 和 SCSI-3, 男 外 即 
将 推出 的 SCSI-4 和 SCSI-5 也 将 加 入 SCSI 家 族 的 行列 。 

SCSI 家 族 类 型 及 各 目 性 能 特征 如 下 。 

(1) SCSI-1: 它 是 最 早 的 SCSI, 在 1979 年 由 Shugart 制订 ,并 于 1986 年 由 ANSI 发 布 
正式 标准 。 它 支持 8 位 并 行 数 据 传输 ,可 同时 连接 7 台 SCSI 设备 ,最 大 数据 传输 率 为 
5MB/s。 

(2) SCSI-2; 它 是 继 SCSI-1 后 的 接口 标准 ,于 1992 年 推出 ,也 称 为 Fast SCSI( 快 速 
SCSI)。 其 中 ,采用 8 位 并 行 数据 传输 的 SCSI 称 为 Fast SCSI(Narrow 模式 ), 它 的 数据 传 
输 率 为 ]0OMB/s, 最 大 支持 连接 设备 数 为 7 台 ; 后 来 出 现 的 来 用 16 位 并 行 数据 传输 的 SCSI 
称 为 Fast Wide SCSI( 快 速 宽带 SCSI) , 它 的 数据 传输 率 提高 到 了 20MB/s, 最 大 支持 连接 设 
备 数 为 15 台 。 

(3) SCSI-3; 它 是 在 SCSI-2 之 后 推出 的 Ultra SCSI( 超 级 SCST) 类 型 ,在 这 个 大 类 中 也 
按 数 据 位 宽 的 不 同 先 后 推出 了 两 个 小 类 。 采 用 8 位 并 行 数据 传输 时 称 为 Ultra SCSI, 它 的 
数据 传输 认为 20MB/s, 最 大 文 持 连接 设备 数 为 8 台 。 在 将 并 行 数 据 传 输 的 总 线 市 宽 提 高 
到 16 PA 出 现 了 Ultra Wide SCSI, 它 它 的 传输 率 又 成 倍 提高 ， 达到 了 40MB/s, 最 大 支持 连接 


(4) Ultra2 SCSI: 它 是 在 Ultra SCSI 的 基础 上 推出 的 SCSI 接口 类 型 。 于 1997 年 提 
出 ,采用 了 低 电 平 微分 (Low Voltage Differential,LVD) 的 传输 模式 ,人 允许 接口 电缆 最 长 为 
12m, 这 大 大 增加 了 设备 的 灵活 性 。 与 上 面 几 种 SCSI 一 样 , 它 也 分 为 采用 8 位 的 Narrow 
模式 和 采用 16 位 的 Wide 模式 。8 位 的 Narrow 模式 即 为 Ultra2 SCSI, 它 的 传输 率 为 
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40MB/s, 最 大 支持 连接 设备 数 为 7 台 ; 而 来 用 16 位 的 Wide 模式 则 称 为 Ultra2 Wide 
SCSI, 它 将 传输 率 提高 到 了 80MB/s, 最 大 支持 连接 设备 数 为 15 台 。 

(5) Ultra3 SCSI; 它 是 Ultra2 SCSI 的 更 新 接口 ,于 1998 年 9 月 份 提 出 , 它 除 支持 现 有 
的 SCSI 规格 ,使 用 和 Ultra2 SCSI 完全 一 样 的 接口 电缆 及 终结 希 外 ,还 包含 了 一 些 新 功能 。 
首先 Ultra3 SCSI 采用 双 缘 传输 频率 (Double Transition Clocking) ,而 Ultra2 SCSI 采用 的 
是 单 缘 传输 频率 ,因此 Ultra3 SCSI 的 传输 率 是 前 者 的 两 倍 , 即 最 高 可 达 160MB/s; 此 外 
Ultra3 SCSI 还 提供 了 领域 确认 .CRC 宛 余 循环 校 验 、 封包 协议 .快速 仲 裁 选 取 等 几 项 新 功 
能 ; 为 了 加 快 Ultra3 SCSI 新 技术 的 推出 ,很 多 厂商 首先 推出 了 Ultral160 SCSI。Ultral60 
SCSI 的 技术 和 Ultra3 SCSI 一 样 ,只 是 没有 快速 仲裁 选取 和 封包 协议 这 两 项 功能 ,可 以 说 
Ultral60 SCSI 就 是 Ultra3 SCSI 的 子 集 。 

(6) Ultra320 SCSI: 它 的 全 称 为 Ultra320 SCSI SPI-4 技术 规范 。Ultra320 SCSI 单 通 
道 的 数据 传输 速率 最 大 可 达 320MB/s ,如 条 来 用 双 通 道 SCSI 控制 前 可 以 达到 640MB/s。 
从 基础 架构 的 发 展 来 看 ,160MB/s 到 320MB/s 的 提升 在 技术 上 并 不 复杂 ,花费 也 不 大 ， 
此 对 于 系统 集成 商 来 说 ;服务 器 从 SCSI Ultral160 SCSI 到 Ultra320 SCSI 的 技术 过 渡 是 非 
第 容易 实现 的 。 


3. SCSI 的 配置 结构 


一 个 SCSI 适 配 兹 通过 一 组 SCSI 总 线 与 多 个 SCSI 设备 连接 ,它们 构成 一 个 独立 的 1/0O 
子 系统 , 称 为 一 个 SCSI 域 。 在 一 台 机 笑 中 可 以 有 多 个 SCSI 域 ,如 图 6-13 所 示 。 其 中 ID 编 
号 用 来 标识 一 个 域 中 的 不 同 设备 ,不 同 域 的 ID 编号 之 间 没 有 关系 ,可 以 重复 。 


SCSI 
适 配 殴 


磁盘 | 磁盘 ? 波 盘 3 

1D 1 1D2 [D3 
SCSI 设 备 3 

[D3 


SCSII 人 第 ] 
[D1 


SCSI 设备 是 沿 着 一 条 SCSI 总 比 构 成 菊花 链接 的 结构 , 即 一 个 SCSI 设备 的 输出 利用 
SCSI 电 缆 连 接 到 另 一 个 设备 的 输入 。CPU 只 与 其 SCSI 适 配 占 进行 通信 , 当 有 需要 时 发 布 
各 种 I/O 〇 命令 ,在 接 下 来 的 时 间 里 ,CPU 执行 日 己 的 任务 ,而 由 SCSI 适 配套 来 负责 管理 和 输 
人 输出 操作 。 


4. SCS| 的 接口 类 型 

SCSI 连接 器 分 为 内 置 和 外 置 两 种 ,内 置 接口 的 外 形 和 IDE 接口 类 似 , 只 是 针 数 和 规格 
稍 有 差别 ,主要 用 于 连接 光驱 和 硬盘 。 外 置 接口 主要 包括 50 针 接 口 、68 针 接 口 和 80 针 接 
口 等 ,如 图 6-14 所 示 ，。 


总 线 与 接口 组 织 


pin 80 
(b) 68 针 SCSI 接 口 


口 的 类 型 


1) DB-50 连接 器 

连 线 上 使 用 50 针 公 接头 ,人 们 通常 称 做 “大 50 接头 ”(Centronics 50-pin) 。DB-50 的 使 
用 率 较 高 ,许多 大 型 的 外 接 设备 都 采用 此 种 接头 。 但 它 的 体型 庞大 ,不 适合 应 用 在 接口 卡 
FE。 它 的 传输 率 不 高 ,应 用 在 SCSI-1、Fast SCSI 等 级 的 设备 上 。 

2) HD-50 连接 器 

连 线 上 使 用 50 针 公 接头 HD-50(High Density 50-pin), 人们 通 篆 称 做 "小 50 接头 ”还 
有 Micro DB-50、Mini DB-50 等 名 称 , 除 了 可 接 Fast SCSI 等 级 设备 之 外 ,还 可 用 于 连接 
Ultra SCSI 等 级 的 高 速 设备 。 由 于 接头 体型 小 ,同样 也 是 50 针 高 密 接 头 ( 比 较 容 易 转 接 )。 
它 几 乎 成 为 了 SCSI 卡 的 标准 外 接 接头 。HD-50 的 传输 率 比 DB-50 快 。 

3) HD-68 连接 器 

连 线 上 使 用 68 针 公 接头 HD-68(High Density 68-pin) ,和 HD-50 同属 于 高 密 接 头 , 但 
针脚 比 HD-50 多 ,适用 于 Wide Ultra2 SCSI 等 级 的 高 速 设备 ,使 用 较 少 ， 

4) HD-80 连接 器 

在 Ultra SCSI 等 级 的 高 速 设备 上 使 用 ,使 用 较 少 ， 


接口 


6.4.2 IEEE 1394 


随 着 计算 机 技术 与 家 电 技 术 的 融合 ,多 巡 体 信息 进入 家 硅 只 不 过 是 个 时 间 的 早晚 问题 ， 
多 媒体 信息 传输 自然 就 成 为 家 电厂 商 与 计算 机 厂商 所 共同 关心 的 问题 。 多 媒体 数据 传输 首 
先 要 求 的 是 实时 性 , 现 有 的 单纯 图 形 传 输 或 网 络 应 用 一 般 对 实时 性 要 求 并 不 高 。 例 如 在 
Internet 上 浏览 主页 , 虽 有 延迟 ,但 一 般 尚 可 接受 ; 如 果 是 在 网 络 上 举行 会 议 ,实时 性 就 会 变 
成 一 个 要 求 十 分 可 刻 的 问题 。 然 后 是 连接 的 方便 性 ,只 有 高 性 能 但 使 用 不 方便 同样 难以 进 
入 家 用 产品 市 场 ,家 电 和 计算 机 融合 就 无 从 谈 起 。 新 的 接口 必须 使 用 简便 才 不 会 影响 其 推 
三 应 用 。 第 三 是 通用 性 ,只 有 不 局 限于 某 种 特定 的 环境 和 设备 , 才 会 拥有 广 泛 的 应 用 和 群体。 
最 后 是 价格 便宜 ,价格 太 贯 ,用 户 数量 就 会 受到 限制 。 

IEEE 1394 正 是 在 这 样 一 种 背景 下 被 提出 来 的 。 它 最 初 是 由 美国 Apple 羊 末 电脑 公司 
在 20 世纪 80 年 代 中 期 开始 人 研发。 当初 羊 果 公司 称 之 为 FireWire( 火 线 ), 而 之 后 的 过 尼 公 
司 则 称 之 为 1. Link ,德州 仪 关 公司 称 之 为 Lynx。 圣 果 公 司 的 FireWire 标准 于 1987 年 制定 
完成 ,但 直到 1994 年 9 月 才 由 IEEE 成 立 了 IEEE 1394 行业 协会 ,由 Adaptec、 AMD、 
Apple,Cirrus Logic,IBM. Microsoft, Molex, Philips, Skip stone,Sony 和 TI 等 公司 组 成 执 
行 委 员 会 ,制定 了 总 线 接 口 标准 , 即 IEEE 1394-1995 技术 规范 。 


228 


MM 


计算 机 组 织 与 结构 


IEEE 1394 是 一 个 高 速 串 行 总 线 接口 标准 , 既 可 作为 总 线 标准 应 用 于 计算 机 主板 ,也 可 
作为 外 部 接口 标准 应 用 于 计算 机 与 各 种 外 部 设备 的 连接 ,尤其 是 与 一 些 现代 数码 电 需 产品 
的 连接 ,如 实现 与 数码 数码 摄像 机 及 各 种 数字 音频 视频 设备 之 间 的 高 速 、 宽 璐 的 数据 
传输 等 。 


1. IEEE 1394 接口 的 特点 


IEEE 1394 的 特点 可 以 归纳 为 以 下 几 个 方面 。 

1) 高 速率 

IEEE 1394-1995 中 规定 标准 数据 传输 速 京 为 100 一 400Mb/s。 新 的 IEEE 1394b 中 更 
高 的 速度 是 800Mby/s 一 3. 2Gb/s。 其 实 400Mb/s 就 几乎 可 以 满足 所有 的 要 求 。 实 际 上 , 数 
字音 视频 数据 一 般 都 要 经 过 压缩 再 进行 传输 ,因此 ,一般 来 讲 200Mbys 已 经 能 够 满足 实际 
音 视 频数 据 传 输 需 要 的 速度 了 。 但 对 多 路 数字 音 视 频 信 号 传输 来 说 ,传输 速率 总 是 越 高 越 
好 、 永 无 止境 。 

2) 传输 距离 长 

虽然 IEEE 1394-1995 标准 允许 其 总 线 长 度 只 有 4.5m, 但 新 的 IEEE 1394b 标准 可 以 实 
现 100m 范围 内 的 设备 互 连 , 这 样 IEEE 1394 设备 的 应 用 就 更 加 方便 了 。 

3) 支持 热 插 拔 和 即 插 即 用 

IEEE 1394 文 持 市 电 捅 拔 设 备 , 接 搬 或 拔 出 装置 不 必 关 闭 电 源 。 同 时 它 还 文 持 即 捅 即 
用 ,增加 新 装置 无 顷 设 置 ,系统 可 有 目 动 识别 并 配置 ,只 要 设备 文 持 IEEE 1394 这 一 标准 即 
可 。 现 在 主流 的 Windows 操作 系统 都 对 IEEE 1394 有 很 好 的 支持 ,在 这 些 操作 系统 中 用 户 
不 用 天安 疙 驱动 程序 ,也 能 使 用 IEEE 1394 设备 。 

4) 接口 简单 .廉价 

IEEE 1394-1995 标准 规范 规定 总 线 中 包含 4 根 信 号 线 和 2 根 电 源 线 ,使 用 细 级 连接 ， 
这 使 得 连接 和 安装 都 十 分 简单 。IEEE 1394 的 控制 软件 和 连接 导线 的 实现 成 本 都 比 并 行 总 
线 要 低 , 而 且 不 需要 解决 信号 干扰 问题 ,因此 成 本 更 加 低廉 。 

5) 互 连 设备 多 

虽然 IEEE 1394 最 多 只 可 支持 63 个 节点 的 1394 设备 串 连 ,但 可 以 满足 绝 大 多 数 应 用 

6) 支持 对 等 传输 

IEEE 1394 对 对 等 传输 的 文 持 也 是 非常 吸引 人 的 ,这 样 两 台 IEEE 1394 设备 无 须 通 过 
计算 机 即 可 实现 点 到 点 的 且 接 相连 和 数据 传输 。 这 意味 者 只 要 设备 文 持 ,就 可 以 方便 地 将 
如 数码 相机 等 与 具有 IEEE 1394 接口 的 便 盘 等 连接 ,并 直接 将 数码 相机 中 的 数据 存储 到 和 硬 
盘 中 。 

7) 支持 同步 和 异步 传输 

IEEE 1394 同时 文 持 同步 和 异步 两 种 数据 传输 方式 。 在 异步 传输 方式 下 ,信息 的 传输 
可 以 被 中 断 ; 而 在 同步 传输 方式 下 ,数据 将 在 不 受 任何 中 断 和 干扰 的 情况 下 实现 连续 的 传 
输 。 同 步 方 式 可 以 很 好 地 应 用 于 实时 视频 数据 流 的 传输 ,满足 视频 画面 质量 的 要 求 。 

8) 灵活 的 传输 模式 

IEEE 1394 的 传输 模式 主要 有 Backplane 和 Cable 两 种 。 其 中 Backplane 模式 是 一 种 
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基于 主板 的 总 线 模式 ,其 所 实现 的 数据 传输 速率 分 别 为 12. 5MB/s、25MB/s、50MB/s, 可 以 
用 于 多 数 带宽 要 求 不 是 很 高 的 应 用 环境 ,如 Modem( 包 括 ADSL、Cable Modem)、 打 印 机 、 
扫描 仪 等 。 而 Cable 模式 是 一 种 快速 接口 模式 ,其 所 能 达到 的 数据 传输 速率 分 别 为 100MB/s、 
200MB/s 和 400MB/s 几 种 ,主要 应 用 于 一 些 数 码 设 备 的 数据 传输 。 

总 之 ,IEEE 1394 既是 新 一 代 接 口 , 又 是 新 一 代 总 线 ; 既是 计算 机 外 设 接口 标 ? 
家 电 接 口 标准 ,目前 已 广 谤 应 用 于 家 庭 和 办 公 等 诸多 领域 。 
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2. IEEE 1394 的 配置 结构 


IEEE 1394 采用 和 菊花 链 式 配置 ,也 允许 树 状 结构 配置 。 事 实 上 , 移 花 链 结构 是 树 状 结构 
的 一 种 特殊 情况 。 

IEEE 1394 接口 也 需要 一 个 主 适 配 和 部 和 系统 总 线 相 连 。 在 PC 中 ,这 个 主 适 配 融 的 功 
能 逻辑 集成 在 主板 的 核心 必 片 组 的 桥 忌 片 中 , 称 之 为 主 站 口 。 主 冰 口 是 1394 接口 树 状 配置 
结构 的 根 节 点 。 一 个 主 端口 最 多 可 连接 63 台 设 备 , 这 些 设 备 称 为 节点 ,它们 构成 亲子 关系 。 
如 图 6-15 所 示 给 出 了 一 个 IEEE 1394 配置 结构 图 。 
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6-15 IEEE 1394 配置 结构 图 


IEEE 1394 采用 集中 式 总 线 仲 裁 方式 。 中 央 仲 裁 逻 辑 在 主 端口 内 ,并 以 先 到 先 服 务 的 
方法 来 处 理 节 点 提出 的 总 线 访问 请 求 。 在 nn 个 节点 同时 提出 使 用 总 线 请 求 时 ,按照 优先 权 
进行 仲裁 。 最 靠近 根 节 点 的 薄 争 节点 有 高 的 优先 权 ; 同样 靠近 根 节 点 的 薄 和 争 闻 点 ,其 设备 
标识 号 ID 大 的 有 更 高 的 优先 权 。 

为 了 保证 总 线 设备 的 对 等 性 和 数据 传输 的 实时 性 ,IEEE 1394 的 总 线 仲 裁 增 加 了 均等 
仲裁 和 紧急 仲裁 功能 。 均 等 仲裁 是 将 总 线 时 间 分 成 均等 的 间隔 , 当 间 隔 期 间 开 始 时 ,竞争 的 
每 个 节点 置 位 自己 的 仲裁 允许 标志 ,在 间 卫 期 内 各 节点 可 范 争 总 线 的 使 用 权 。 一 有 旦 某 闻 点 
获得 总 线 访 问 权 , 则 它 的 仲裁 允许 标志 被 复位 ,在 此 期 间 它 不 能 再 去 竞争 总 线 , 以 此 来 防止 
具有 高 优先 权 的 忙 设备 独占 总 线 。 紧 急 仲 裁 指 对 某 些 高 优先 权 的 节点 可 为 其 指派 紧急 优先 
权 , 具 有 紧急 优先 权 的 厄 点 可 在 一 个 间 阳 期 内 多 次 获得 总 线 控制 权 , 人 允许 它 控 制 75% 的 上 总 
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线 可 用 时 间 。 
3. |EEE 1394 的 接口 类 型 


IEEE 1394 有 6 针 和 4 针 两 种 接口 类 型 ,也 就 是 常 说 的 大 口 和 小 口 ,如 图 6-16 所 示 。 
6 针 接 口外 观 为 六 角形 ,4 针 接 口外 观 为 小 型 四 和 角形。 最 早 芋 果 公 司 开 发 的 IEEE 1394 接 
口 是 6 针 的 ,后 来 ,SONY 公司 看 中 了 它 数 据 传 输 速 认 快 的 特点 ,将 早期 的 6 针 接 口 进行 改 
恨 ,重新 设计 成 为 现在 大 家 所 篆 见 的 4 针 接 口 , 并 且 命 名 为 1 Link。 这 种 连接 需 如 果 要 与 标 
准 的 6 导线 线 缆 连 接 的 话 ,需要 使 用 转换 其。 
6 针 和 4 针 两 种 接口 的 区 别 在 于 能 否 通 过 连接 线 绒 回 所 连接 
的 设备 供电 。6 针 接 口中 有 4 针 是 用 于 传输 数据 的 信号 线 , 男 外 2 
针 是 加 所 连接 的 设备 供电 的 电源 线 。 对 于 低 电 源 设备 ,电费 中 提 
让 供 的 电源 可 以 满足 设备 的 电源 需求 ,因而 无 须 配 备 外 接 电源 连接 
和 和 。 器 ,这 就 是 6 针 接口 的 优点 。 而 4 针 接口 则 省 去 了 2 根 电源 线 ,和 
a ”i 下 的 4 根 线 全 部 为 数据 信号 线 。 由 于 接口 电线 未 含 电源 线 , 因 此 ， 
EE i 使 用 4 针 接 口 连接 的 设备 必须 单独 供电 。 
图 6-16 IEEE 1394 接口 在 应 用 方面 ,一 般 来 讲 ,6 针 的 接口 主要 用 于 普通 的 台式 计算 
机 ,很 多 主板 都 整合 了 这 种 接口 ; 在 笔记 本 和 一 体 机 等 计算 机 中 
则 大 多 采用 4 针 。 男 外 ,在 数码 和 家 电 产 品 中 ,采用 4 针 的 情况 也 比较 多 。 特 别 是 近 一 段 时 
间 ,笔记 本 电脑 和 DV 都 在 绷 看 小 型 化 和 超 溥 化 方 回 发 展 ,4 针 接 口 在 外 观 尺 寸 上 要 比 6 和 针 
的 小 很 多 ,因此 占用 空间 小 。 另 外 ,并 非 所 有 设备 都 需要 通过 接口 供电 ,例如 很 多 DYV 的 
1394 接口 主要 用 于 传输 影像 数据 ,所 以 无 须 在 接口 上 供电 。 而 还 有 些 设 备 仅 徘 接口 电 统 上 
的 供电 满足 不 了 了 要求, 例如 像 硬盘 这 种 对 于 电量 要 求 较 高 的 设备 就 很 难 从 其 所 接 入 的 设备 
中 得 到 充足 的 电力 供应 ,在 一 定 场 合 下 需要 使 用 一 个 外 接 电源 。 


6.4.3 USB 接口 


人 们 对 PC 机 箱 背 面 的 几 个 标准 外 设 接口 应 该 已 经 很 熟悉 了 ,一 是 串 行 接口 (又 称 
COM 口 ) ,二 是 并 行 接口 ,三 是 PS2 口 。 串 行 接口 支持 的 是 串 行 数据 传输 ,其 数据 传输 速度 
可 以 达到 115 一 230kbys ,一 般 被 用 来 连接 早期 的 鼠标 和 Modem 等 慢 速 设备 ; 并 行 接口 文 
持 的 是 并 行 数 据 传 输 ,其 数据 传输 率 能 达到 1MB/s 左右 ,一 般 被 用 来 连接 打印 机 ,扫描 仪 等 
对 速率 要 求 较 高 的 外 设 ; PS2 口 则 用 来 连接 现代 PC 的 键盘 和 鼠标 。 

对 串 行 接口 和 并 行 接口 而 言 , 一 方面 它们 所 能 达到 的 数据 传输 速度 低 ; 男 一 方面 每 个 
串口 或 并 口上 只 能 连接 一 个 设备 ,所 以 ,它们 都 有 具有 扩展 能 力 差 的 先天 不 足 。 男 外 ,虽然 现 
在 很 多 串 行 /并 行 设备 都 可 以 实现 即 搬 即 用 ,但 热 搬 拔 仍然 是 个 危险 的 动作 。 

而 USB 正 是 为 了 解决 速度 、 扩 展 能 力 和 易 用 性 这 三 个 问题 而 提出 的 低 成 本 解决 方案 。 
1994 年 ,Intel .Compaq Digital ,IBM.、Microsoft、 NEC, Nortel 7 家 计算 机 和 通信 厂商 为 了 解 
决 上 述 问 题 ,联合 成 立 了 USB 论坛 ,并 分 别 于 1996 年 、1998 年 ,1999 年 .2008 年 和 2013 年 
正式 制订 了 USB 1.0、USB 1.1、USB 2.0、USB 3.0 及 USB 3. 1 规范 ,用 于 形成 统一 的 PC 
外 设 接口 标准 。 


种 6 章 ”已 线 与 接口 组 织 


USB 论坛 于 1996 年 1 月 正式 提出 USB 1.0 规格 ,带宽 为 12MB/s。 不 过 因为 当时 支持 
USB 的 周边 装置 少 得 可 怜 , 所 以 主机 板 厂 商 不 太 把 USB 口 直接 设计 在 主机 板 上 。 

USB 1. 1 规范 在 1998 年 9 月 提出 用 来 修正 USB 1.0, 但 传输 的 带宽 不 变 , 仍 为 12MB/s。 
USB 1. 1 回 下 莱 容 于 USB 1.0， 

USB 2.0 技术 规范 是 在 1999 年 发 布 的 ,把 外 设 剖 
USB 1. 1 设备 的 40 倍 。 

USB 3.0 标准 在 2008 年 11 月 18 日 公开 发 布 ,新 规范 提供 了 十 信 于 USB 2.0 的 传输 
速度 (5Gb/s) 和 更 高 的 节能 效率 ,可 广泛 用 于 PC 外 围 设 备 和 消费 电子 产品 。 

USB 3. 1 规范 在 2013 年 发 布 。 新 标准 在 接口 方面 没有 什么 改变 ,但 它 可 以 岳 
USB 3.0 的 传输 速度 ( 即 10Gb/s) ,同时 还 能 向 下 兼容 USB 2. 0。 

目前 ,USB 接口 已 成 为 PC 上 标准 配置 的 接口 类 型 ,其 应 用 也 越 来 越 广 泛 ,除了 一 些 计 
算 机 传统 的 设备 如 键盘 .鼠标 .打印 机 等 逐渐 采用 USB 接口 方式 与 主机 连接 外 ,各 种 家 电 产 
品 也 纷纷 加 入 了 USB 的 行列 。 


是 各 高 皇上 | T 480 MB,/ a 年 


供 两 倍 于 


1. USB 接口 的 特点 


USB 的 全 称 是 Universal Serial Bus, 即 通用 串 行 总 线 , 其 主要 特点 如 下 。 
1) 高 速度 


与 传统 的 串 行 接口 和 并 行 接口 相 比 较 ,USB 接口 提供 的 数据 传输 速度 更 快 。 其 中 
USB 1. 1 提供 全 速 (12MB/s) 和 低速 (1. 5MB/s) 两 种 速率 来 适应 各 种 不 同类 型 的 外 设 , 而 
USB 2.0 的 传输 速度 可 以 达到 480MB/s,USB 3. 0 的 传输 速度 可 以 高 达 5Gb/s, 目前 已 发 
展 到 USB 3. 1 版 本 ,数据 传输 速率 达 

2) 即 插 即 用 和 支持 热 插 拔 

与 IEEE 1394 接口 一 样 ,系统 对 USB 设备 能 够 自动 识别 和 自动 配置 ,并 且 允 许 在 不 关 
闭 电 源 的 情况 下 对 USB 设备 直接 插 拔 。 

3) 可 以 连接 多 个 设备 

IEEE 1394 最 多 只 可 支持 63 个 节点 的 1394 设备 连接 ,而 USB 所 连接 的 设备 更 多 。 
USB 设备 可 以 直接 连 在 PC 上 任意 的 USB 接口 ,还 可 以 使 用 USB Hub 进行 扩展 ,使 更 多 的 
USB 设备 连接 到 系统 中 。USB 的 Hub 有 一 个 上 行 端口 用 于 连接 到 Host, 多 个 下 行 闪 口 连 
接 其 他 的 设备 ,它们 以 一 种 分 层 星 型 结构 的 方式 互 连 , 使 整个 系统 最 多 可 以 扩展 连接 127 个 
设备 ,这 足以 满足 各 种 应 用 的 需要 。 

4) 文 持 多 种 数据 传输 方式 

针对 设备 对 系统 资源 需求 的 不 同 ,USB 规范 规定 了 4 种 不 同 的 数据 传输 方式 : 一 是 控 
制 传输 方式 ,这 是 一 种 双 回 传送 方式 ,数据 量 通常 比较 小 。 二 是 同步 传输 方式 传送 ,这 种 传 
输 方 式 提 供 了 确定 的 市 宽 和 间 阳 时间, 它 被 用 于 时 间 严 格 并 具有 较 踢 容错 性 的 流 数据 传 
输 ,或 者 用 于 要 求 恒 定 的 数据 传送 率 的 即时 应 用 中 。 三 是 中 断 传 输 方式 ,这 种 传输 方式 
典型 的 应 用 在 少量 的 ,分散 的 ,不 可 预测 数据 的 传输 ,键盘 、 操 纵 杆 和 鼠标 就 属于 这 一 类 
型 。 四 是 大 量 数据 传输 方式 ,主要 应 用 在 大 量 数据 的 传输 和 接收 上 ,打印 机 和 扫描 仪 等 
属于 这 种 类 型 。 
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2. USB 的 配置 结构 


USB 的 物理 连接 采用 的 是 一 种 分 层 的 星 型 结构 ,USB Hub 是 每 个 星 型 结构 的 中 心 , 主 
机 则 相当 于 根 Hub, 所 有 USB 设备 或 者 直接 与 主机 相连 ,或 者 与 USB Hub 相连 。USB 
Hub 可 以 级 联 , 最 多 可 达 5 层 , 所 连接 设备 最 多 为 127 个 。 与 IEEE 1394 稍 有 不 同 的 是 ， 
USB 设备 只 能 上 连 到 主机 或 USB Hub ,设备 之 间 不 能 互 连 ; 而 IEEE 1394 的 设备 则 可 以 互 
连 成 菊花 链 结构 以 及 对 等 互 连 。 对 于 这 一 点 ,通过 如 图 6-17 所 示 的 USB 配置 结构 和 如 
图 6-15 所 示 的 IEEE 1394 配置 结构 的 比较 就 可 以 很 容易 地 理解 


主机 


usB 设 和 | vse USB Hub 


“| | 


图 6-17 USB 配置 结构 


3. USB 的 接口 类 型 


所 有 USB 设备 都 需要 通过 USB 电费 来 实现 与 计算 机 主机 的 物理 连接 才能 正常 使 用 。 
USB 电 统 分 为 屏蔽 型 和 非 屏 蔽 型 两 种 ,人 们 使 用 的 大 多 数 部 是 非 屏 蔽 型 的 USB 电 统 。 不 
书 何 种 类 型 的 电 统 ,它们 的 接头 虱 是 一 样 的 ,一 端 为 局 形 的 接口 , 称 为 上 行 问 口 ,用 于 连接 主 
机 或 USB Hub 的 扩展 端口 ; 为 一 并 为 方形 接口 , 称 为 下 行 端 口 , 用 于 连接 USB 设备 及 
USB Hub ,如 图 6-18 所 示 。 


USB 通过 一 根 4 线 电 统 来 传输 信号 和 电源 ,其 中 两 线 组 成 

一 对 传输 数据 的 差 模 信号 线 , 男 两 线 则 提供 了 十 5V 的 电源 ,可 
、 人 WW ””S、 以 有 条 件 地 给 一 些 设备 供电 。 

总、 USB 设备 的 供电 通常 有 两 种 方式 。 一 种 是 设备 本 身 不 带 独 

二 吕 一 立 的 电源 适配器 ,电源 由 主机 的 USB 接口 直接 供应 。 这 种 设备 

6-18 USB 接口 大 多 是 耗 电 量 不 大 的 纯 电 路 类 产品 ,如 USB 接口 的 Modem、 鼠 

标 、U 盘 、MP3 等 ; 另 一 种 USB 设备 需要 单独 供电 ,这 类 设备 通 

党 都 是 机 电 一 体 的 装置, 如 USB 接口 的 扫描 仪 . 打 印 机 等 ,因为 这 些 设备 的 机 械 传动 部 分 需 

要 大 功率 的 电源 才能 驱动 。 
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知识 拓展 
串 行 传输 还 是 并 行 传输 ? 

从 技术 发 展 的 情况 来 看 ,USB 取代 IEEE 1284,SATA 取代 PATA,PCI Express 取代 
PCI…… 似 乎 品行 传输 方式 大 有 彻底 取代 并 行 传输 方式 的 势头 。 

从 原理 来 看 ,并 行 传输 方式 其 实 优 于 串 行 传输 方式 。 那 么 ,为何 现在 的 串 行 传输 方式 会 
更 胜 一 筹 ? 下 面 将 从 并 行 、 串 行 的 变革 以 及 技术 特点 分 析 隐 藏 在 其 表面 现象 背后 的 深层 
原因 。 

计算 机 中 的 总 线 和 接口 是 主机 与 外 部 设备 间 传 输 数 据 的 “大 动脉 ”, 随 着 处 理 器 速度 的 
节 节 区 升 ,总 线 和 接口 的 数据 传输 速度 也 需要 逐步 提高 ,否则 就 会 成 为 计算 机 发 展 的 瓶颈 ， 
从 计算 机 中 使 用 的 ISA 总 线 发 展 到 PCI 总 线 就 足以 说 明 这 一 点 。 

并 行 数据 传输 技术 向 来 是 提高 数据 传输 率 的 重要 手段 ,但 是 ,进一步 发 展 却 遇 到 了 障 
碍 。 首 先 , 由 于 并 行 传输 方式 的 前 提 是 用 同一 时 序 传播 信号 ,用 同一 时 序 接收 信号 ,而 过 分 
提升 时 钟 频 座 将 难以 让 数据 传输 的 时 序 与 时 钟 合拍 ,布线 长 度 稍 有 差异 ,数据 就 会 以 与 时 钟 
不 同 的 时 序 送 达 。 此 外 ,提升 时 钟 频率 还 容易 引起 信号 线 间 的 相互 干扰 ,因此 ,并 行 方式 难 
以 实现 高 速 化 。 另 外 ,增加 位 宽 无 疑 会 导致 主板 和 扩充 板 上 的 布线 数目 随 之 增加 ,成 本 随 之 
芍 升 。 

至 于 如 果 有 人 问 关于 串 行 传输 与 并 行 传输 谁 更 好 ? 目前 只 能 说 “在 相同 频率 下 并 行 伟 
输 速 率 更 高 ?这 个 基本 道理 是 永远 不 会 错 的 ,通过 增加 位 宽 来 提高 数据 传输 率 的 并 行 策略 仍 
将 发 挥 重要 作用 。 当 然 ,前 提 是 有 更 好 的 措施 来 解决 并 行 传输 的 种 种 问题 。 串 行 传输 现在 
之 所 以 走红 ,是 由 于 将 单 端 信号 传输 转变 为 差分 信号 传输 ,并 提升 了 控制 器 工作 频率 的 
原因 。 

技术 进步 周而复始 ,以 至 无 穷 , 没 有 一 项 技术 能 够 永远 适用 。 计 算 机 技术 将 来 跨 入 
THz 时 代 后 ,对 信号 传输 速度 的 要 求 会 更 高 ,差分 传输 技术 是 否 能 满足 要 求 ? 是 否 需要 另 
一 种 更 好 的 技术 来 完成 频率 的 另 一 次 突破 呢 ? 不 妨 找 目 以 符 ! 


本 章 小 结 


< 章 主 要 讲述 了 以 下 内 容 : 

(1) 总 线 概述 。 讲 述 了 总 线 的 基本 概念 .总 线 的 类 型 .总 线 的 规范 和 单 总 线 .局 部 总 线 、 
多 总 线 结 构 等 ,介绍 了 总 线 的 控制 方式 ,包括 总 线 的 仲裁 .总 线 的 定时 和 总 线 的 数据 传输 模 

(2) 总 线 标准 及 总 线 举 例 。 介 绍 了 几 种 应 用 非常 广泛 的 系统 总 线 ( 以 ISA 总 线 为 例 ) 和 
局 部 总 线 (PCI 总 线 、PCLX 总 线 以 及 PCI-Express 总 线 ) ,介绍 了 这 些 总 线 的 特点 .配置 结 
构 及 应 用 。 

(3) 外 部 总 线 接口 标准 。 讲 述 了 小 型 计算 机 系统 接口 SCSI 和 两 种 新 型 的 高 速 串 行 总 
线 IEEE 1394 和 USB, 这 两 种 总 线 接口 标准 在 计算 机 中 得 到 了 越 来 越 广泛 的 应 用 ,尤其 是 
对 于 今后 计算 机 与 家 用 电表 的 连接 和 融合 将 起 到 越 来 越 重 要 的 作用 。 
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习题 六 


一 、 名 词 解释 
1. 总 线 2. 局 部 总 线 3. 外 部 总 线 4. 前端 和 总线 
二 、 选 择 题 
1. 下 列 有 关 对 总 线 的 描述 不 正确 的 是 ( ) 。 
A. 总 线 是 可 共享 的 B. 总 线 是 可 独占 的 
C. 总 线 的 效 据 传输 是 串 行 的 D. 通过 总 线 仲裁 实现 对 总 线 的 占用 
2. 通过 总 线 可 以 ( ke 
A. 减少 部 件 之 间 的 连接 信和 号 线 B. 提高 部 件 之 间 的 传输 速度 
C. 增加 数据 信号 线 的 条 数 D. 增加 地 址 信号 线 的 条 数 
3. 系统 总 线 是 用 于 连接 ( ) 。 
A. 存储 项 各 个 模块 B.CPU ,存储 硕 和 I/O 设备 
C. 主机 与 /O 设备 D. 计算 机 与 计算 机 
4. 下 列 描述 PCI 总 线 正确 的 是 ( Ds 
A. PCI 总 线 是 一 个 与 处 理 机 无 关 的 高 速 外 围 总 线 
B. PCI 总 线 的 基本 传输 机 制 是 串 行 传输 
C. PCI 设备 一 定 是 主 设 备 
D. 系统 中 只 允许 有 一 条 PCI 总 线 
5. 下 列 不 属于 外 部 总 线 标准 的 是 ( ) 。 
A. IEEE 1394 B. USB C. SCSI D. ISA 
6. 一 次 电线 事物 中 , 主 设 备 只 需 给 出 一 个 首 地 址 ,从 设备 就 能 从 站 地址 开始 的 大 干 连 
续 单 元 格 读 出 或 写 入 的 个 数 ,这 种 总 线 事务 方式 称 为 ( )。(2014 年 全 国人 硕士 妍 究 生 入 
学 统一 考试 计算 机 学 科 专 业 基 础 综合 试题 ) 
A. 并 行 传 输 B.， 串 行 传输 C. 突 发 D. 同步 
7. 下 列 选 项 中 ,用 于 设备 和 设备 控制 郑 (LIO 接口 ) 之 间 互 连 的 接口 标准 是 ( ) 。 
(2013 年 全 国人 硕士 妍 究 生 人 学 统一 考试 计算 机 学 科 专 业 基 础 综合 试题 ) 
A. PCI B. USB C. AGP D. PCI-Express 
8. 某 同步 总 线 的 时 钟 频率 为 100MHz, 宽 度 为 32 位 ,地 址 /数据 线 复 用 ,每 传送 一 次 地 
址 或 者 数据 占用 一 个 时 钟 周期 。 奢 该 总 线 支 持 突 发 ( 锐 发 ) 传 输 方 式 , 则 一 次 “ 主 存 写 ” 总 线 
事务 传输 128 位 数据 所 需要 的 时 间 至 少 是 ( ) 。(2012 年 全 国人 硕士 研究 生 和 人 学 统一 考试 
计算 机 学 科 专 业 基 础 综合 试题 ) 
A. 20ns B. 40ns (. 5Ons D. 80ns 
9. 下 列 关 于 USB 总 线 特性 的 摘 述 中 ,错误 的 是 ( ) 。(2012 年 全 国人 希 士 钱 究 生 入 学 
统一 考试 计算 机 学 科 专 业 基 础 综合 试题 ) 
A. 可 实现 外 设 的 即 插 即 用 和 热 拔 插 
B. 可 通过 级 联 方式 连接 多 台 外 设 
C. 是 一 种 通信 和 总线, 连接 不 同 外 设 
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D. 同时 可 传输 2 位 数据 ,数据 传输 率 高 
. 下 列 选项 中 ,在 1/O 总 线 的 数据 线 上 传输 的 信息 包括 ( ) 。(2012 年 全 国 硕士 
mA 考试 计算 机 学 科 专 业 基 础 综合 试题 ) 
. IO 接口 中 的 命令 字 .1/O 接口 中 的 状态 字 芽 . 中 断 类 型 号 
A. 仅 工 .IT B. 仅 上 上、 左 C. 仅 工 、 焉 D. 工 . 工 、 焉 

、 守 合 是 
为 什么 总 线 结 构 适 合 于 计算 机 系统 中 各 部 件 的 互 连 ? 再 列举 几 种 书 中 没有 提 到 的 
各, 并 总 线 结构 进行 比较 。 
线 两 个 最 主要 的 特点 是 什么 ? 
总 线 中 都 有 哪些 类 型 的 信号 线 ? 分 别 用 于 传输 哪 种 信息 ? 
. 总 线 按 功 能 及 所 连接 的 部 件 种 类 可 划分 为 哪 几 类 ? 
. 什么 是 系统 总 线 ? 列举 几 种 计算 机 中 和 常用 的 系统 总 线 。 
， 什么 是 总 线 带宽 ? 
总 线 仲裁 主要 实现 什么 功能 ? 有 了 哪些 总 线 仲 裁 方 式 ”? 
按 总 线 定 时 方式 的 不 同 , 有 哪 两 种 总 线 数据 传输 方式 ? 
总 线 标准 主要 定义 了 哪 几 个 方面 的 特性 (规范 )? 
9). PCI 总 线 提 供 了 哪 几 类 ”* 桥 ?? 分 别 起 到 什么 作用 ? 
1. 试 将 SCSI 与 IDE 接口 进行 对 比 。 
. 试 将 IEEE 1394 接口 与 USB 接口 进行 对 比 。 
没 某 数据 总 线 为 32 位 ,总 线 时 钟 频率 为 33MHz, 求 该 数据 总 线 的 市 宽 。 

14. 观察 自己 使 用 的 家 用 电 顺 产品 ,看 看 它们 分 别 使 用 了 什么 样 的 接口 标准 ,在 与 计算 
机 的 连接 上 是 怎样 使 用 和 操作 的 。 
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将 运算 器 、 控 制 器 集成 在 一 个 芯片 上 称 为 中 央 处 理 器 (CPU), 随 大 超大 规模 集成 电路 
(VLSI) 技 术 的 发 展 ,CPU 中 还 集成 了 一 级 或 多 级 高 速 缓冲 存储 器 (cache)。CPU 是 计算 机 
系统 的 核心 组 成 部 件 , 在 微型 计算 机 中 ,又 把 CPU 称 为 微 处 理 器 。 

本 章 首先 介绍 CPU 的 功能 与 组 成 ; 然后 介绍 CPU 的 指令 周期 及 执行 指令 的 过 程 ; 最 
后 介绍 CPU 控制 部 件 设计 的 两 种 主要 方法 : 硬 布线 设计 法 和 微 程 序 设计 法 。 


7.1 CPU 的 功能 和 组 成 


随 者 集成 电路 设计 制造 及 工艺 水 平 的 进步 , 心 片 的 集成 度 越 来 越 高 ,可 以 制造 出 功能 
越 来 越 强 大 的 集成 电路 ,这 使 得 计算 机 的 中 央 处 理 右 (CPU) 的 性 能 越 来 越 强 。 虽 然 不 同时 
期 ,不同 广 家 生产 的 CPU 在 功能 、 组 成 结构 上 有 许多 差异 ,但 CPU 的 基本 功能 对 机 天 
指令 的 执行 和 数据 的 处 理 进 行 全 过 程 的 控制 ,不 会 改变 。 


7.1.1 CPU 的 功能 


第 3 曹 介绍 了 指令 系统 ,指令 系统 是 一 人 台 计 算 机 所 能 够 执行 的 全 部 指令 集合 。 当 用 计 
各 机 解决 是 个 问题 时 首先 必须 为 它 编写 程序 或 者 利用 已 有 的 程序 ,程序 是 由 一 系列 指令 按 
解决 问题 的 步骤 构成 的 ,这 个 序列 明确 地 告诉 计算 机 应 该 执行 什么 操作 ,在 什么 地 方 找到 用 
来 操作 的 数据 。 程 序 一 旦 净 并 人 主 和 存储 带 ， 计算 机 就 能 按照 程序 规定 的 顺序 目 动 .逐条 地 取出 
指令 ,对 指令 进行 译 人 码 并 执行 指令 ,直到 指令 序列 全 部 执行 完毕 ,程序 所 要 求 的 功能 及 对 信 
恩 进 行 的 加 工 和 处 理 也 就 完成 了 。 因 此 ,整个 计算 机 工作 的 过 程 就 是 不 断 地 取出 指令 、 对 指 
令 进行 译 码 并 执行 指令 的 过 程 。 专 门 用 来 完成 此 项 工作 的 计算 机 部 件 称 为 中 央 处 理 器 
(Central Processing Unlit,CPU) 。 

CPU 对 于 整个 计算 机 系统 的 
功能 。 

(1) 指令 控制 。 

程序 的 顺序 控制 称 为 指令 控制 。 巾 于 程序 是 一 个 指令 序列 ,这 些 指令 的 顺序 不 能 任意 
颠倒 ,必须 严格 按 程序 规定 的 顺序 进行 。 

(2) 操作 控制 。 
一 条 指令 的 功能 往往 是 由 硅 干 个 操作 信号 的 组 合 来 实现 的 ,因此 ,CPU 管理 并 产生 由 


起 来 它 具 有 以 下 4 个 方面 的 基本 


运行 是 极其 重要 的 , 归 
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内 存 ( 或 指令 cache) 取 出 的 每 条 指令 的 操作 信和 号 ,把 各 种 操作 信号 送 往 相 应 的 部 件 , 从 而 控 
制 这 些 部 件 按 指令 的 要 求 进 行动 作 。 

(3) 时 间 探 制 。 

对 各 种 操作 进行 时 间 上 的 定时 称 为 时 间 控 制 。 在 计算 机 中 ,各 种 指令 的 操作 信号 以 及 
一 条 指令 的 整个 执行 过 程 都 将 党 到 时 间 的 严格 定时 。 

(4) 数据 加 工 。 

数据 加 工 就 是 对 数据 进行 算术 运算 和 逻辑 运算 处 理 ,并 进行 逻辑 测试 等 。 

在 执行 指令 的 过 程 中 ,如 出 现 运算 的 洲 出 错误 、 存储 天 校 验 错 及 外 部 设备 的 服务 请 求 等 
异 稼 情况 时 ,必须 转 人 异 稼 处 理 ; 异 篆 处 理 一 般 由 中 断 机 构 执 行 中 断 服务 程 序 来 完成 。 所 
以 , 取 指 令 、 分 析 指 令 并 执行 指令 是 CPU 本 质 的 功能 。 


7.1.2 CPU 的 基本 组 成 


在 早期 的 计算 机 中 ,运算 各 和 控制 各 是 组 成 计算 机 的 两 个 部 件 , 后 来 出 现 了 集成 电路 拉 
本, 把 运算 般 和 控制 天 集成 在 一 个 忆 片 中 称 为 中 央 处 理 胡 (CPU ) 。 

CPU 有 通用 CPU 和 和 散 入 式 CPU。 通 用 和 和 散人 入 式 的 分 别 , 主 要 是 根据 应 用 模式 的 不 同 
而 划分 的 。 通 用 CPU 忆 斤 的 功能 一 般 比 较 强 ,能 运行 复杂 的 操作 系统 和 大 型 应 用 软件 ; 骸 
人 式 CPU 在 功能 和 性 能 上 有 很 大 的 变化 范围 。 随 着 集成 度 的 提高 ,在 艇 入 式 应 用 中 ,人 们 
倾 问 于 把 CPU 存储 郑 和 一 些 外 围 电路 集成 到 一 个 性 上 族 上 ,构成 所 请 的 系统 尾 片 ( 催 称 为 
SoC) ,而 把 SoC 上 的 那个 CPU 称 为 CPU 核 。 


1. 运算 兹 


运算 角 是 计算 机 中 的 执行 部 件 , 它 接 有 党 控制 锅 的 命令 而 动作 ,从 而 完成 对 信息 的 加 工 和 
处 理 。 运 算 般 主要 由 算术 逻辑 单元 (ALU) 、 累 加 寄存 般 C(AC) .数据 缓冲 寄存 般 CDR) 和 状 
态 条 件 寄存 器 (PSW) 及 通用 寄存 占 组 (REG) 等 组 成 ,目前 许多 CPU 还 内 置 了 协 处 理 需 , 主 
要 什 贡 浮 点 运算 和 向 量 运 算 。 

(1) 算术 逻辑 运算 单元 (Arithmetic and Logic Unit, ALU) 

ALU 主要 完成 对 二 进 制 数据 的 定点 算术 运算 (加 \ 减 . 乘 、 除 ). 逻辑 运算 (与 、 或 . 非 、 腊 
或 ) 以 及 移 位 操作 等 ,在 某 些 CPU 中 还 有 专门 用 于 处 理 移 位 操作 的 移 位 闫 。 通 和 冰 ALU 有 
两 个 输入 病 和 一 个 输出 疾 。 整 数 单 元 有 时 也 称 为 IEU(Integer Execution Unit) ,通常 所 许 
的 “CPU 是 XX 位 的 ?就 是 指 ALU 所 能 处 理 的 数据 的 位 数 。 

(2) 浮 点 运算 单元 (Floating Point Unit,FPU) 

FPU 主要 负责 浮 点 运算 和 高 精度 整数 运算 。 有 些 FPU 还 具有 癌 量 运 人 
一 些 则 具有 专门 的 问 量 处 理 单元 ， 

(3) 通用 寄存 促 组 

通用 寄存 各 组 是 一 组 最 快 的 存储 各 ,用 来 保存 参加 运算 的 操作 数 和 中 间 结 果 。 在 通用 
寄存 右 的 设计 上 ,RISC 与 CISC 有 着 很 大 的 不 同 。CISC 的 寄存 融通 种 很 少 , 主 要 是 受 了 当 
时 硬件 成 本 所 限 ,比如 x86 指令 集 只 有 8 个 通用 寄存 项 。 所 以 ,CISC 的 CPU 执行 指令 时 大 
多 数 时 间 是 在 访问 存储 关中 的 数据 ,而 不 是 寄存 骨 , 这 就 拖 慢 了 整个 系统 的 速度 。 而 RISC 
系统 往往 具有 非常 多 的 通用 寄存 器 ,并 采用 了 重 全 寄存 器 窗口 和 寄存 器 堆 等 技术 使 寄存 器 


的 功能 ,万 外 
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资源 得 到 充分 的 利用 。 

对 于 x86 指令 集 只 文 持 8 个 通用 寄存 甫 的 缺点 ,Intel 和 AMD 的 最 新 CPU 都 米 用 了 
一 种 叫做 “寄存 前 重 命 名 ”的 技术 ,这 种 技术 使 x86 CPU 的 寄存 部 可 以 突破 8 个 的 限制 , 达 
到 32 个 甚至 更 多 。 不 过 ,相对 于 RISC 来 说 ,及 用 这 种 技术 的 寄存 着 操 作 要 多 出 一 个 时 钟 
周期 ,用 来 对 寄存 从 进行 重 命名 。 

(4) 专用 寄存 天 

专用 寄存 器 通常 是 一 些 状态 寄存 器 ,不 能 通过 程序 改变 ,由 CPU 自己 控制 ,表明 某 种 


状态 。 
2. 控制 器 


控制 项 主要 由 程序 计数 需 (PC) ,指令 寄存 右 (IR) .指令 译 码 需 、 地 址 译 码 需 、 时 序 发 生 
信和 操作 控制 冀 等 组 成 。 探 制 血 是 计算 机 中 发 布 命令 的 “决策 机 构 ”, 即 完成 协调 和 指挥 整 
个 计算 机 系统 的 操作 。 它 接受 来 自主 存储 豆 的 指令 ,根据 各 条 机 带 指 令 的 不 同 功能 和 要 求 ， 
正确 地 .严格 地 按照 一 定 的 时 间 次 序 为 各 个 部 件 提供 操作 控制 信号 ,并 控制 各 个 寄存 大 之 
间 、CPU 同 主 存 及 1/O 设备 之 间 的 数据 流向 。 

信息 要 在 不 同 部 件 之 间 流 动 ,就 上 必须 有 传送 的 通路 。 多 个 寄存 需 之 间 传 送信 息 的 路 径 
称 为 数据 通路 。 信 息 从 什么 地 方 开 始 ,中 间 经 过 哪个 寄存 器 或 多 路 开关 ,最 后 传送 到 哪个 寄 
存盘 ,部 要 加 以 控制 。 在 各 寄存 冀 之 间 建 立 数 据 通 路 的 任务 ,是 由 称 为 操作 控制 各 的 部 件 来 
完成 的 。 操 作 探 制 各 的 功能 就 是 根据 指令 操作 人 码 和 时 友信 号 ,产生 各 种 微 操作 控制 信号 ,以 
更 正确 地 建立 数据 通路 ,从 而 完成 取 指 令 和 执行 指令 的 控制 。 

根据 操作 控制 器 的 组 成 及 产生 微 操作 控制 信号 方法 的 不 同 ， 控制 器 可 分 为 

1) 硬 布线 控 制 基 ,采用 组 合 逻辑 技术 或 门 阵 列 实现 。 

(2) 微 程 序 控 制 硕 ,采用 存储 逻辑 实现 。 

无 论 是 看 布线 控制 硕 还 是 征程 序 控制 善 ,它们 所 给 出 的 控制 信号 都 是 在 一 个 称 为 时 订 
发 生 副 的 部 件 所 产生 的 连续 时 友信 和 号 的 同步 下 产生 的 ,由 这 些 控制 信和 号 控制 计算 机 的 各 个 
部 件 有 条 不 茶 地 工作 ， 

随 着 超大 规模 集成 电路 (VLSD 技 术 的 发 展 ,许多 早期 放 在 CPU 外 部 的 功能 部 件 被 集 
成 到 CPU 内 部 ,使 得 CPU 的 内 部 结构 越 来 越 复 杂 。 现 在 通用 的 CPU 中 除 集成 了 运算 项 、 
控制 项 部 件 ,还 集成 了 高 速 缓 存 (cache) 。 近 年 来 ,在 一 个 芯片 上 集成 了 多 个 处 理 基 核心 称 
为 多 核 处 理 器 ,有 关 多 核 处 理 需 的 内 容 请 参考 8. 5 节 。 

CPU 内 置 cache 的 容量 和 结构 对 CPU 的 性 能 影响 很 大 ,一 般 容量 越 大 越 好 。 在 许多 
i I 需 内 部 ,一 级 缓存 通常 设置 为 两 个 ,一 个 指令 cache, 一 个 数据 cache, 以 减少 取 指 

卖 操 作 数 的 访问 冲突 ,这 种 结构 也 叫 哈 佛 结构 。 

Intel 80386 CPU 不 包含 片 内 cache, 但 首次 在 CPU 外 部 (主板 上 ) 使 用 了 cache 技术 。 
80486 CPU 速度 的 提高 使 外 部 总 线 成 为 处 理 骨 访问 外 部 cache 的 瓶颈 ,于 是 在 486 片 内 使 用 
1 一 个 小 容量 的 cache(8KB); Pentium 系列 CPU 片 内 则 集成 了 一 级 ,二 级 甚至 二 级 ole 
容量 也 越 ; 小 大 。 有 关 Pentium 系列 CPU 片 内 cache 的 详细 内 容 请 参考 4. 4. 0 小 用 
“为 方便 读者 建 立 计算 机 整 机 概念 ,对 CPU 内 部 结构 进行 了 一 一 定 的 简化 ,给 出 如 图 7-1 
所 示 的 CPU 模型 。 
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图 7-1 CPU 模型 
7.1.3 CPU 的 寄存 器 组 织 


计算 机 中 传送 的 信息 包括 控制 信息 和 数据 信息 ,而 办 和 存 胡 束 是 用 来 暂 存 这 些 信息 的 部 
件 。 在 CPU 内 部 有 多 个 寄存 大 ,有 的 用 于 数据 处 理 , 有 的 用 于 控制 ,还 有 的 用 作 CPU 与 主 
人 存 、VO 接口 间 传 送信 息 。 下 面 将 详细 介绍 这 些 寄 存 硕 的 功能 与 结构 。 


1. 累加 寄存 再 


宗 加 寄存 关 (Accumulator,AC) 通 第 简称 为 标 加 着 , 它 是 一 个 通用 寄存 闫 ,其 功能 是 : 
当 运 算 顺 的 算术 逻辑 单元 (ALU) 执 行 算 术 或 逻辑 运算 时 ,为 ALU 提供 一 个 工作 区 。 累 加 
寄存 器 可 提供 操作 数 ,也 可 存放 运算 结果 。 显 然 , 运 算 器 中 至 少 要 有 一 个 累加 寄存 器 。 

目前 CPU 中 的 累加 寄存 器 ,多 达 16 个 ,32 个 ,甚至 更 多 。 当 使 用 多 个 累加 器 时 ,就 变 
成 通用 寄存 器 结构 ,其 中 任何 一 个 都 可 存放 源 操 作 数 ,也 可 存放 运算 结果 。 在 这 种 情况 下 ， 
需要 在 指令 格式 中 对 寄存 硕 进 行 编 址 。 通 用 寄存 天 是 一 组 用 户 编 程 时 可 访问 的 .具有 多 种 
功能 的 寄存 融 , 在 指令 系统 的 说 明和 资料 中 会 说 明 这 组 寄存 郑 的 存在 与 基本 用 途 。 

有 的 计算 机 将 这 组 寄存 器 设计 成 基本 通用 ,如 PDP-11 中 的 通用 寄存 顺 组 命名 为 Ro、 
Ri 、R;、… ,它们 可 被 指定 担任 各 种 工作 ,大 部 分 寄存 帮 设 有 特定 的 分 工 。 有 的 计算 机 则 为 
这 组 寄存 硕 分 别 规定 某 一 基本 任务 ,并 按 各 目的 基本 任务 命名 ,如 Intel 80x86 CPU 设置 
有 : 累加 天 (CAC) 、 基 址 寄存 各 (BR) ,计数 寄存 熏 (CR) ,数据 寄存 大 CDR) 等 。 


2. 用 于 控制 的 寄存 兹 


(1) 指令 寄存 髓 (Instruction Register ,IR) 
指令 寄存 器 用 来 保存 当前 正在 执行 的 一 条 指令 。 当 执行 一 条 指令 时 , 先 把 它 从 内 存 中 
取出 并 放 到 组 冲 寄 人 存 表 中 ,然后 再 传 送 至 指令 寄存 本 。 指 令 划 分 为 操作 码 和 地 址 码 字 段 , 由 
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二 进 制 代码 表示 。 为 了 执行 任何 给 定 的 指令 ,必须 对 操作 人 码 进 行 测试 ,以 便 识 别 所 要 求 的 操 
作 。 指 令 详 码 天 就 是 做 这 项 工作 的 。 指 令 寄 人 存 胡 中 操作 但 字 段 的 输出 就 是 指令 详 公 天 的 输 
和 ,操作 码 一 经 诺 码 后 , 即 可 加 操作 控制 天 发 出 具体 操作 的 特定 信和 号 。 

为 了 提高 谈 取 指令 的 速度 ,前 在 主 存 的 数据 寄存 甫 与 指令 寄存 化 间 建 立 和 直接 传送 通路 。 
为 了 提高 指令 加 的 衔接 速度 ,大 多 数 计算 机 都 将 指令 寄存 闫 扩充 为 指令 队列 ,允许 预 取 香干 
条 指令 。 

(2) 程序 计数 项 (Programme Counter,PC) 

为 了 保证 程序 能 够 连续 地 执行 下 去 ,CPU 必须 通过 革 些 手段 来 确定 下 一 条 指令 的 地 
址 。 而 程序 计数 盘 (PC) 正 是 起 到 这 种 作用 的 ,所 以 通 第 又 称 为 指令 计数 咽 。 在 程序 开始 执 
行 前 ,必须 将 它 的 起 始 地 址 , 即 程序 的 第 一 条 指令 所 在 的 内 存单 元 地 址 送 入 PC, 因 此 PC 的 
内 容 即 是 从 内 存 提 取 的 第 一 条 指令 的 地 址 。 当 程序 流程 为 顺序 执行 时 ,每 谈 取 一 条 指令 后 ， 
程序 计数 各 的 内 容 就 增 量 计数 ,以 指 回 后 继 指 令 的 地 址 。 硅 主 存 按 字 方 编 址 , 则 增 量 值 取决 
于 指令 字 书 数 , 例 如 每 读 取 一 条 单字 廊 指令 ,PC 值 相 应 加 1; 如 有 果 读 取 一 条 二 字 广 指令, 则 
PC 加 2。 

但 是 , 当 遇 到 转移 指令 (如 JMP 指令 ) 时 ,那么 后 继 指 令 的 地 址 ( 即 PC 的 内 容 ) 必 须 从 
指令 的 地 址 字段 取得 。 在 这 种 情况 下 ,下 一 条 从 内 存 取出 的 指令 将 由 转移 指令 来 规定 ,而 不 
是 像 通 靖 一 样 按 顺序 来 取得 。 因 此 程序 计数 兰 应 当 是 具有 计数 和 寄存 信息 两 种 功能 的 寄 

(3) 状态 条 件 寄 存 骨 (Programme Status Word,PSW ) 

CPU 的 主要 工作 是 执行 程序 ,其 过 程 一 方面 取决 于 编程 时 的 程序 流 癌 , 另 一 方面 也 取 
决 于 程序 实际 执行 的 状态 。 因 此 ,许多 计算 机 设置 有 一 个 状态 条 件 寄 存 希 ,其 内 容 表示 
CPU 当前 的 基本 状态 ,也 就 是 现行 程序 的 状态 ,第 称 为 程序 状态 字 (PSW)。 其 中 一 部 分 所 
容 记 载 程 序 运 行 的 状态 ,为 一 部 分 内 容 可 由 编程 设 定 , 如 设置 工作 方式 等 。 

PSW 中 的 硅 干 位 可 用 来 记录 程序 执行 状态 , 称 为 标志 位 或 特征 位 。 一 条 指令 执行 后 ， 
将 根据 运行 结 采 有 目 动 修改 标志 位 的 有 关内 容 , 作 为 决定 程序 流 回 的 因素 之 一 , 篆 见 的 标志 
位 有 : 

进位 标志 CC, 表示 运算 后 是 否 有 进位 产生 。 

溢出 标志 OV ,表示 运算 结果 是 否 有 溢出 。 

全 零 标 志 2 ,表示 运算 结果 是 否 为 零 。 

件 号 标志 N ,表示 运算 结果 是 否 为 负数 。 

奇偶 标志 己 , 表 示 运 算 结 果 中 1 的 个 数 是 奇数 还 是 偶数 。 

有 的 计算 机 还 设置 有 中 断 允许 (IF) 、 半 进位 标 坊 CAF) . 单 步 标 坟 CITF) 方 癌 标 志 (CDF ) 
(地 址 由 低 到 高 ,还 是 由 高 到 低 ) 等 。 


3， 用 于 主 存 接 口 的 寄存 兹 


当 CPU 访问 主 存 或 1/O 接口 时 , 均 应 首先 送出 地 址 码 , 然 后 再 读 、 写 数据 。 为 此 ,常设 
置 以 下 两 个 寄存 胡 。 

(1) 地 址 寄存 顺 

地 址 寄存 全 (Address Register,AR) 用 来 保存 当前 CPU 所 访问 的 内 存单 元 的 地 址 。 由 
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于 在 内 存 和 CPU 之 间 存 在 着 操作 速度 上 的 差别 ,所 以 必须 使 用 地 址 寄存 带 来 保持 地 址 信 
恩 , 直 到 内 存 的 谈 / 写 操作 完成 为 止 。 

当 CPU 和 内 存 进行 信息 交换 , 即 CPU 从 内 存 读 / 写 
令 时 ， dan 


数据 时 ,或 者 CPU 从 内 存 中 取 指 
同样 ,如 果 把 外 围 设备 的 设备 地 址 作为 像 内 
交换 信息 时 ,同样 要 使 用 地 址 寄存 器 


数据 缓冲 寄存 器 CData Register, DR) 用 来 暂时 存放 由 内 存 读 出 的 一 条 指令 或 一 个 炎 
据 ; 反之 , 当 同 内 存 存 入 一 个 数据 时 ,也 暂时 将 它们 存放 在 数据 缓冲 寄存 右 中 。 

缓冲 寄存 器 的 作用 是 : 

作为 CPU 和 内 存 、 外 部 设备 之 间 信 息 传送 的 中 转 站 ，; 

补偿 CPU 和 内 存 、 外 围 设备 之 间 在 操作 速度 上 的 差别 ; 

在 单 社 加 兹 结构 的 运算 各 中 ,数据 绥 冲 寄存 带 还 可 腾 作 操作 数 寄 存 疾 。 

设置 AR 与 DR ,使 CPU 与 主 存 间 的 传送 通路 变 得 比较 单一 ,容易 控制 。 对 用 户 来 说 ， 
这 两 个 寄存 器 往往 是 “透明 ”的 ,不 能 直接 编程 访问 。 

地 址 寄存 器 (AR) ,数据 缓冲 寄存 右 (DR) ,指令 寄存 右 (IR) 的 结构 一 样 ,通常 使 用 单纯 
的 寄存 天 结构 。 信 息 的 存 人 一 般 有 用 电位 -脉冲 方式 , 即 电 位 输入 闪 对 应 数据 信息 位 ,脉冲 
输入 问 对 应 控制 信号 ,在 控制 信号 的 作用 下 ,实时 地 将 信息 打 人 寄存 髓 。 


CPU 对 指令 的 执行 必须 有 条 不 系 ,为 此 ,指令 被 分 成 一 个 个 操作 步 , 称 为 微 操 作 。 每 一 
个 微 操作 被 分 配 到 一 个 时 间 单 元 中 执行 ,以 保证 它们 在 执行 上 的 顺序 关系 。 在 7.2 节 , 先 介 
绍 一 些 时 间 概 念 ,然后 以 一 个 模型 机 为 例 , 介 绍 一 些 典 型 指令 如 何 进 一 步 划 分 成 一 个 个 微 操 
作 以 及 这 些微 操作 的 执行 过 


计算 机 之 所 以 能 自动 工作 ,是 因为 预先 编写 好 了 解决 问题 的 
程序 并 把 daddy 开始 pb 能 按 要 求 从 内 存 中 
取出 一 条 指令 并 执行 这 条 指令 又 取 下 一 条 指令 ,执行 下 

条 指令 … 如 此 周而复始 ,构成 了 一 个 封闭 的 循环 。 除 非 遇 到 
停机 指令 ,否则 这 个 循环 将 一 直 继 续 下 去 ,其 过 程 如 图 7-2 所 示 。 

指令 的 处 理 过 程 需要 一 定 的 时 间 , 取 指令 需要 时 间 , 指 令 的 执 
行 也 需要 时 间 , 通 常 将 CPU 从 内 存 中 取出 一 条 指令 并 执行 这 条 指 
令 的 时 间 总 和 称 为 指令 周期 。 

由 于 各 机 器 指令 的 功能 不 同 , 指 令 中 操作 数 所 采用 的 寻 址 方 
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式 也 不 尽 相 同 , 故 不 同 指令 执行 的 时 间 长 短 是 不 相同 的 , 即 不 同 机 器 指令 的 指令 周期 各 不 相 
同 。 如 同样 是 加 法 指令 ,操作 数 采 用 寄存 器 寻 址 和 直接 寻 址 所 花 的 时 间 就 不 相同 。 

指令 周期 通常 用 机 器 周期 来 描述 ,机 器 周 期 义 称 为 CPU 周期 。 指 令 执 行 过 程 中 每 一 步 
操作 (如 取 指 令 ) 所 需 的 时 间 对 应 着 一 个 CPU 周期 ,由 于 CPU 访 存 的 时 间 相 对 CPU 内 部 
操作 的 时 间 较 长 , 常 将 从 内 存 读 出 一 个 指令 的 最 短 时 间作 为 一 个 CPU 周期 , 它 代 表 了 大 多 
数 指令 操作 步骤 的 时 间 。 

而 一 个 CPU 周期 又 包含 奉 干 个 时 钟 周 期 ,如 图 7-3 所 示 。 时 钟 周期 也 叫做 节拍 脉冲 或 
TT 周期 , 它 对 应 看 计算 机 中 最 基本 的 定时 信号 ,由 它 可 推出 计算 机 的 主 时 钟 频 率 。 


T] T7173 17 T7773| ra 
CPU 周 其 CPU 周期 


( 取 指 令 ) 指令 周期 (执行 指令 ) 


图 7-3 指令 周期 


应 当 指 出 ,在 不 同 的 计算 机 中 对 CPU 周期 的 规定 是 不 尽 相 同 的 ,有 的 指令 周期 包含 的 
CPU 周期 数 多 ,有 的 则 较 少 。 有 的 机 器 中 一 个 CPU 周期 中 所 包含 的 时 钟 周期 数 是 固定 的 ， 
这 叫 定 长 机 器 周期 ,如 图 7-3 所 示 ; 而 有 的 机 需 则 采用 不 定 长 的 机 部 周 期 ,如 图 7-4 所 示 。 


7 周期 


了 ] i2 13 7 三] 12 [3 


CPU 同 期 | CPU 间 期 
( 取 指 令 ) 指令 周期 (执行 指令 ) 


7-4 ”不定 长 的 机 兹 周期 


(1) 取 指 周期 。 

取 指 周期 是 每 条 指令 都 必须 有 的 。 取 指 周期 要 完成 两 项 任务 ,一 是 要 以 PC 的 内 容 为 
地 址 从 主 存 中 取出 指令 代码 送 IR, 二 是 要 修改 PC 形成 后 继 指 令 地 址 。 但 是 , 当 执 行 转移 指 
令 时 ,PC 中 的 地 址 在 转移 指令 的 执行 阶段 修改 。 

(2) 取 操 作 数 周期 。 

这 个 机 各 周期 的 任务 是 形成 操作 数 地 址 并 获取 操作 数 , 操 作 数 地 址 的 形成 与 寻 址 方式 
有 关 ,提供 操作 数 的 部 件 可 以 是 寄存 套 , 也 可 以 是 存储 天 ,因此 , 取 操 作 洛 


改 的 操作 因 指 令 而 不 
同 。 有 些 指令 的 执行 过 程 是 不 需要 取 操 作 数 的 ,因此 ,这 个 机 髓 周期 不 是 每 条 指令 都 必须 


有 的 。 


(3) 执行 周期 。 

执行 周期 的 主要 任务 是 完成 指令 操作 人 码 规定 的 操作 ,并 记录 指令 执行 后 的 状态 信息 。 
执 不 j 周 期 的 操作 对 不 同 的 指令 也 是 不 相同 的 。 

综 上 所 述 , 一 条 指令 的 指令 周期 至 少 包 括 两 个 机 和 带 周期 ,不同 的 指令 需要 的 机 各 周期 数 


征 不 同 的 。 


第 7 章 ”CPU 组 织 与 结构 


【 例 7. 1】 某 计 算 机 执行 一 条 指令 平均 需要 3 个 CPU 周期 ,平均 需 访 问 内 存 2 次。 
个 CPU 周期 包含 4 个 时 钟 则 期。 看 计算 机 主 频 为 100MHz, 问 |: 

(1) 右 主 存 为 “0 等 行 “〈 即 不 需 揪 和 人 等 符 周 期 ), 问 指令 执行 的 平均 速度 为 多 少 ? 

(2) 知 每 次 访问 内 存 需 插入 一 个 等 竺 周期 , 问 执行 一 条 指令 的 平均 时 间 为 多 少 ? 指令 
执行 的 平均 速度 又 是 多 少 ? 

解 : 计算 机 主 频 为 100MHz, 所 以 时 钟 周期 为 


] ~ 8 | 
er 100 wx ] 0 H> ] ~ 10 -3 lO0Ons 


(1) 因为 每 个 CPU 周期 包含 4 个 时 钟 周期 ,所 以 CPU 周期 为 
了 cp 一 4 XX Ter 一 4Uns 
所 以 ,平均 速度 为 


1 ] | 
-一 一 一 一 - ”人 、>: 8 33MIPS 
3Tcpy 3X40ns 3X40X10-9s 


(2) 执行 一 条 指令 平均 需要 3 个 CPU 周期 , 需 访问 内 存 2 次 ,E 
一 个 等 竺 周期 ,所 以 执行 一 条 指令 的 平均 时 间 为 
3TceU 十 27cr = 3 X40ns 2 Xx 1l0ns = l40ns 


每 次 访问 内 存 需 插 入 


平均 速度 为 


] 1 | 
31cpu Tt 21erk l40ns 1. 14MIFS 


7.2.2 典型 指令 的 指令 周期 


表 7-1 给 出 了 4 条 典型 指令 组 成 的 一 个 简单 程序 ,其 中 LDA 是 数据 传送 指令 ,ADD 是 
加 法 指令 会 Mp eile 指令 ,JMP 丰 巨 娄 件 转移 扣 " gg 7.2.2 万 退 


表 7-1 典型 指令 组 成 的 一 个 简单 程序 


六 进 制 数 地 址 十 六 进 制 数 代码 和 指令 功能 说 明 
0011 AC<—(AC)+ (00E0H) 


00E0 
00E]1 


O00F0O 


1. LDA 指令 的 指令 周期 
假定 表 7-1 的 简单 程序 已 装 人 内 存 中 ,程序 计数 髓 (PC) 指 向 程序 的 首 地 址 , PC 一 
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0010H, 即 存放 LDA 00H 指令 的 内 存单 元 ,所 以 CPU 首先 执行 的 第 一 条 指令 是 LDA。 
LDA 00H 采用 立即 寻 址 ,执行 阶段 不 要 访问 内 存 , 其 功能 是 把 立即 数 传 送 到 累加 需 , 其 指令 
周期 如 图 7-5 所 示 。 它 需要 两 个 CPU 周期 ,其 中 取 指 令 阶 段 需 要 一 个 CPU 周期 ,执行 指令 
阶段 需要 一 个 CPU 周期 。 


取 指 令 阶段 执行 指令 阶段 
图 7-5 ”LDA 的 指令 周 


第 一 个 CPU 周期 是 取 指 周期 ,CPU 完成 三 件 事 : 由 从 内 存 取出 指令 。 包 对 程序 计数 
大 PC 加 1, 为 取 下 一 条 指令 做 好 准备 。(3) 对 指令 操作 人 码 进行 译 码 或 测试 ,以 便 确 定 进行 什 
么 操作 。 

在 第 二 个 CPU 周期 , 即 执行 指令 阶段 ,CPU 根据 对 指令 操作 码 的 译 码 得 到 的 操作 控制 
信和 号 ,进行 指令 所 要 求 的 操作 。 对 非 访 内 指令 来 说 ,执行 阶段 通 篆 涉 及 对 素 加 全 进行 操作 ， 
如 累加 器 内 容 清 零 . 求 反 等 操作 。 显 然 , 其 他 一 些 零 地 址 格式 的 指令 ,执行 阶段 也 仅 需要 一 
个 CPU 周期 。 

1) 取 指 周期 

LDA 的 取 指 周期 操作 如 图 7-6 所 示 ,在 此 阶段 内 ,CPU 的 操作 如 下 : 
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7-6 LDA 00H 的 取 指 
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QO 程序 计数 右 (PC) 的 内 容 0010H 被 装 入 地 址 寄存 器 (AR)。 

@ 程序 计数 器 内 容 加 1, 变 成 0011H ,为 取 下 一 条 指令 做 好 准备 。 

G) 地 址 寄存 天 的 内 容 被 放 到 地 址 总 线 上 。 

4) 所 选 和 存储 表单 元 0010H 的 内 容 经 过 数据 总 线 , 传 送 到 数据 缓冲 寄存 大 CDR) 。 

中 缓冲 寄存 顺 的 内 容 传 送 到 指令 寄存 大 (IR)。 

( 指令 寄存 郑 中 的 操作 人 三 被 译 码 或 测试 。 

DD CPU 识别 出 是 指令 LDA ,至 此 , 取 指 令 阶 段 即 告 结束 。 

需要 说 明 的 是 , 取 指 周期 的 过 程 和 数据 通路 对 每 条 指令 来 说 都 是 一 样 的 ,所 不 同 的 是 
PC 的 值 和 取得 的 指令 代码 不 一 样 。 后 续 指 令 ADD、 STR JMP 的 取 指 周期 与 LDA 指令 相 
可， 因此 不 必 生 复 讨 论 。 

2) 执行 指令 阶段 

LDA 指令 的 执行 阶段 如 图 7-7 所 示 ,在 此 阶段 内 ,CPU 的 操作 如 下 : 

中 经 译 码 后 知道 LDA 00H 指令 采用 立即 寻 址 方式 ,操作 数 跟 在 操作 码 之 后 ,已 经 存放 
在 指令 寄存 融 (IR) 中 ,操作 控制 硕 送 出 控制 信号 ,在 了 藉 与 数据 缓冲 寄存 融 (DR) 之 间 建 立 数 
据 通路 ,把 立即 数 打 入 DR.。 

操作 控制 器 再 送出 控制 信号 在 DR 与 ALU 之 间 建 立 痢 
的 输入 端 。 

G ALU 啊 应 传送 操作 控制 信和 号 ， 
完了 LDA 00H 指令 


据 通 路 ,把 立即 数 送 到 ALU 


税 输入 ALU 的 数据 送 到 累加 寄存 器 (AC) ,从 而 执行 


ww |k 


A 证 有 

Ao010 LDAOH | 
0011 | ADD[EOH] _ 
STR[EOHI] 
0013 |JMPIIH 
EU 
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图 7-7 LDA 指令 执行 阶段 
2. ADD 指令 的 指令 周期 


取出 第 一 条 指令 LDA 时 ,PC 的 内 容 已 经 加 1 变 成 了 0011H, 这 个 地 址 指向 存放 ADD 
LEO0H 指令 的 内 存单 元 ,所 以 接 下 来 执行 的 指令 是 ADD [| EO0H |。 
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ADD 指令 是 一 条 访问 内 存 取 数 并 执行 加 法 的 指令 , 它 的 指令 周期 由 三 个 CPU 周期 组 
成 ,如 图 7-8 所 示 。 其 中 第 一 个 CPU 周期 为 取 指 令 阶 段 , 执 行 阶 段 由 两 个 CPU 周期 组 成 ， 
其 中 在 第 二 个 CPU 周期 中 计算 并 送 操 作 数 地 址 ,第 三 个 CPU 周期 读 操 作 数 执行 加 法 


执行 加 和 
\ 法 操作 ， 


/ 送 操作 \ 
\ 数 地 址 / 


执行 指令 阶段 
图 7-8 ADD 的 指令 周期 


0012H。 
2) 计算 并 传送 操作 数 地 址 
第 二 个 CPU 周期 主要 根据 寻 址 方式 计算 操作 数 址 
作 如 图 7-9 所 示 , 在 此 阶段 内 ,CPU 的 操作 如 下 : 
(1) ADD [EO0H] 是 直接 寻 址 ,操作 数 地 址 为 00EOHL。 
(2) 把 指令 寄存 硕 中 的 地 址 码 部 分 (CE0H) 交 人 地 址 寄存 大 (AR) 。 
(3) 把 地 址 寄存 需 中 的 操作 数 地 址 (00E0H) 发 送 到 地 址 总 线 上 


址 ,传送 操作 数 地 址 。 此 阶段 的 捍 
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3) 读 操 作 数 执行 加 法 操作 

第 三 个 CPU 周期 主要 完成 加 法 操作 ,如 图 7-10 所 示 , 在 此 阶段 ,CPU 完成 以 下 动作 : 
从 存储 器 单元 (00E0H) 中 读 出 操作 数 (0005H) ,并 经 过 数据 总 线 传送 到 缓冲 寄存 器 。 由 数 
据 绥 冲 寄 人 存 融 来 的 操作 数 (0005H) 可 送 往 ALU 的 一 个 输入 端 ,已 等 候 在 办 加 帮 内 的 男 一 
个 操作 数 ( 因 为 LDA 00H 指令 执行 结束 后 累加 器 内 容 为 去 ) 送 往 ALU 的 另 一 输入 端 , 于 是 
ALU 将 两 数 相 加 ,产生 运算 结果 为 0 十 0005H 二 0005H。 这 个 结果 放 回 累加 器 ,替换 了 累加 
从 中 原先 的 数 0000H。 
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7-10 ” ADD 指令 的 加 法 操作 阶段 


3. STR 指令 的 指令 周期 


取出 ADD [EO0H] 指 令 时 ,PC 的 内 容 已 经 加 1 变 成 了 0012H, 这 个 地 址 指向 存放 STR 
LFOH 指令 的 内 存单 元 ,所 以 接 下 来 执行 的 指令 是 STR [FOH |。 

STR [FoHj 是 一 条 直接 寻 址 指令 ,把 累加 器 (CAC) 的 内 容 存 人 内 存单 元 , 它 的 指令 周期 
由 三 个 CPU 周期 组 成 ,如 图 7-11 所 示 。 其 中 第 一 个 CPU 周期 为 取 指 令 阶 段 ,第 二 个 CPU 
周期 中 计算 并 送 操作 数 地 址 ,第 三 个 CPU 周期 写 操作 数 进 存储 单元 。 


′ 取 指 令 \ 
、 PC+] 


~、 / 
取 指 令 阶 段 执行 指令 阶段 
图 7-11 STR 的 指令 周 
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1) 取 指 令 阶 段 

STR LFOH | 指令 的 第 一 个 CPU 周期 完成 取 指 令 控 作 并 对 指令 详 人 码 。STR 指令 取出 
后 ,PC 王 0013H ,为 取 下 一 条 指令 做 好 了 准备 。 

2) 计算 并 传送 操作 数 地 址 

STR [FoHJ 指 令 的 第 二 个 CPU 周期 与 ADD LEOHJ 指 令 的 第 二 个 CPU 周期 的 操作 相 
同 ,只 是 计算 并 传送 的 操作 数 地 址 码 为 00FOHL。 

3) 写 操作 数 进 存储 单元 

第 三 个 CPU 周期 主要 完成 送 操 作 数 地 址 ,访问 内 存单 元 存 操作 数 。 此 阶段 的 操作 如 
7-12 所 示 ,在 此 阶段 内 ,CPU 的 操作 如 下 : 

(1) 累加 器 AC 的 内 容 (0005H) 被 传送 到 数据 缓冲 寄存 器 (DR ) 。 

(2) 把 缓冲 寄存 天 (DR) 的 内 容 (0005H) 发 送 到 数据 总 线 上 。 

(3) 操作 控制 着 发 出 写 WR 控制 信号 ,将 0005H 写 入 存储 冀 00FOH 单元 中 。 
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图 7-12 STR 指令 写 操作 数 进 存 储 单元 


注意 . 在 这 个 操作 之 后 ,累加 器 中 仍然 保留 和 数 0005H ,而 存储 器 00FOH 单元 中 原先 
的 ] 内 容 被 修改 。 


4. JMP 指令 的 指令 周期 


STR [FOH ] 指 令 取 出 后 ,PC 二 0013H, 因 此 下 一 条 要 执行 的 指令 是 存放 在 0013H 单元 
的 JMP 11H 指令 。JMP 是 一 条 程序 控制 转移 指令 ,其 指令 周期 由 两 个 CPU 周期 组 成 ,如 
图 7-13 所 示 。 其 中 第 一 个 CPU 周期 为 取 指 令 阶 段 ,第 二 个 CPU 周期 为 执行 阶段 。 

1) 取 指 令 阶 段 

CPU 把 0013H 号 单元 的 JMP 11H 指令 取出 送 到 指令 寄存 器 (CIR) ,同时 程序 计数 名 
(PC) 的 内 容 加 1, 变 为 0014H ,指令 译 码 后 知道 IR 中 的 指令 是 无 条 件 转移 指令 。 
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取 指 令 阶 段 执行 指令 阶段 
图 7-13 JMP 的 指令 周期 


2) 执行 阶段 

CPU 把 指令 寄存 器 (IR) 中 的 地 址 码 部 分 0011H 送 到 程序 计数 器 ,从 而 用 新 内 容 
0011H 代替 PC 原先 的 内 容 0014H。 这 样 , 下 一 条 指令 将 不 从 0014H 单元 读 出 ,而 是 从 内 
存 0011H 单元 开始 读 出 并 执行 ,从 而 改变 了 程序 原先 的 执行 顺序 。JMP 指令 执行 阶段 的 操 
作 如 图 7-14 所 示 。 


mo 


A 主 恒 
TE ET 


存放 和 数 


图 7-14 JMP 11H 的 执行 阶段 


注意 : 执行 JMP 11H 指令 时 ,这 里 所 给 的 四 条 指令 组 成 的 程 厅 进 入 了 死 循环 ,除非 人 
为 停机 ,否则 这 个 程序 将 无 休止 地 运行 下 去 ,因而 内 存单 元 00FOH 中 的 和 数 将 一 直 不 断 地 
发 生变 人 化。 当然, 此 处 所 洽 的 转移 地 址 0011H 是 随意 的 ,用 来 说 明 转 移 指 令 仅 仅 能 够 改变 
程序 的 执行 顺序 而 已 ， 


7.2.3 指令 周期 的 方 框图 语言 朱 述 


7. 2. 2 节 通 过 画 CPU 内 部 数据 通路 的 方法 ,介绍 了 几 条 指令 的 指令 周期 ,这 种 方法 直 
观 、 形 象 ,有 利于 读者 理解 指令 的 执行 过 程 。 在 进行 计算 机 设计 时 ,如 果 用 这 种 办 法 来 表示 


250 


so/ 


计算 机 组 织 与 结构 


指令 周期 , 那 就 显得 过 于 烦琐 ,而 且 也 没有 必要 。 

在 进行 计算 机 设计 时 ,可 以 来 用 方 框图 语言 来 表示 一 条 指令 的 指令 周期 。 一 个 方 框 代 
表 一 个 CPU 周期 , 方 框 中 的 内 容 表 示 数 据 通路 的 操作 或 某 种 控制 操作 。 委 形 框 通 筑 用 来 
表示 某 种 判别 或 测试 ,不 过 时 间 上 它 依 附 于 紧 接 它 的 前 面 一 个 方 框 的 CPU 周期 ,而 不 单独 
占用 一 个 CPU 周期 。 

把 7.2.2 市 的 4 条 典型 指令 加 以 归纳 ,用 方 框图 语言 表示 的 指令 周期 如 图 7-15 所 示 ，。 
从 图 7-15 中 可 以 看 出 ,所 有 指令 的 取 指 令 阶 段 是 完全 一 样 的 ,都 是 占用 一 个 CPU 周期 。 但 
是 由 于 各 条 指令 的 功能 不 同 , 不 同 指令 执行 阶段 所 占用 的 CPU 周期 数 是 各 不 相同 的 ,其 中 
LDA、 STR 和 JMP 是 一 个 CPU 周期 ,ADD 是 两 个 CPU 周期 。 

开始 


ARP<C, PC+1: 
ABUS<—AR: 


DR—DBUS: 
IR— DR 


- 译 码 或 测试 二 
LDA ADD 本 STR JMP 


DR<—IR | AR<—IR AR<—IR ] ] 
ALU<—DR BUS—AR. RD DR<—AC PC<IR 
AC—ALU DR--DBUS ABUS- 一 AR 


DBUS—DR, WR 


ALU—DR, ALU<—AC 


7-15 用 方 框图 语言 表示 的 指令 周期 


图 7-15 中 DBUS 表示 数据 总 线 , ABUS 表示 地 址 总 线 ,RD 表示 内 存 读 命令 ,WR 表示 
内 存 写 命令 “一 一 ”表示 公 操 作 符号 。 公 操作 就 是 一 条 指令 执行 完毕 后 ,CPU 要 进行 的 一 
些 操作 ,这 些 操作 主要 是 CPU 对 外 设 请 求 的 处 理 , 如 中 断 处 理 、 通 道 处 理 等 。 如 果 没 有 外 
设 请 求 要 处 理 ,那么 CPU 又 转向 内 存 取 下 一 条 指令 。 由 于 所 有 指令 的 取 指 令 阶 段 完 全 是 
一 样 的 ,因此 , 取 指令 也 可 认为 是 公 操作 。 所 以 ,一 条 指令 的 指令 周期 结束 后 ,一 定 会 转 人 公 
操作 。 


7. 3 CPU 的 时 友和 探 制 


CPU 是 通过 指令 周期 -节拍 -工作 脉冲 三 级 时 序 系统 来 控制 指令 的 执行 的 。 在 本 节 中 将 
主要 介绍 控制 指令 执行 的 时 序 系统 和 CPU 的 控制 方式 。 


7.3.1 CPU 的 时 序 系 乡 
通过 7. 2 节 的 讲解 已 经 看 到 ,指令 在 CPU 中 执行 时 ,是 通过 控制 器 产生 的 操作 控制 信 
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号 去 控制 各 个 部 件 完成 指令 的 功能 的 。 由 此 可 以 看 出 ,指令 还 可 以 再 进一步 细 分 为 更 小 的 
操作 步 , 称 为 微 操 作 。 微 操作 是 CPU 控制 执行 单元 所 能 完成 的 最 小 操作 步 , 如 部 件 之 间 的 
数据 传送 .运算 或 执行 部 件 所 执行 的 操作 等 。 

由 于 执行 指令 的 各 微 操 作 是 有 先后 次 序 的 ,并 且 许 多 控制 信号 的 长 短 也 有 严格 的 时 间 
限制 ,这 就 需要 引 和 人 时序 信 叶 对 它们 进行 定时 控制 。 时 序 系 统 是 控制 部 的 心 胜 ,其 功能 是 为 
指令 的 执行 提供 各 种 定时 信和 号。 

7.2 方 讨 论 了 典型 指令 的 指令 周期 ,指令 周期 由 硅 干 机 笑 周 期 组 成 。 不 同 指令 的 指令 
周期 是 不 完全 相同 的 。 在 时 序 系统 中 一 般 不 为 指令 周期 设置 完整 的 时 间 标 志 信 号 ,因此 一 
般 不 将 指令 周期 视 为 时 序 的 一 级 。 由 于 CPU 内 部 的 操作 速度 快 ,而 CPU 访问 主 存 所 开销 
的 时 间 较 长 ,所 以 许多 计算 机 系统 往往 以 主 存 的 存 取 周期 为 基础 来 规定 机 器 周期 的 长 度 。 
通 稼 ,每 个 机 需 周 期 都 有 一 个 与 之 对 应 的 周期 状态 触发 需 , 机 娠 运行 在 不 同 的 机 需 周 期 时 ， 
其 对 应 的 周期 状态 触发 需 被 置 为 "1?。 显 然 ,在 机 顺和 运行 的 任何 时 刻 只 能 处 于 一 种 周期 状 


态 , 因 此 有 一 个 且 仅 有 一 个 周期 状态 触发 大 被 置 为 "1”。 


1. 节拍 


一 个 机 顺 周 期 内 要 完成 春 干 微 操作 ,其 中 有 的 可 并 行 执行 ,有 的 要 求 顺序 操作 。 因 此 ， 
需要 把 一 个 机 器 周期 分 为 者 十 个 相等 的 时 间 段 ,每 一 时 间 段 对 应 一 个 节拍 信和 号, 称 为 节拍 脉 
冲 信 和 号。 市 拍 的 宽度 取决 于 CPU 完成 一 次 基本 操作 的 时 间 , 如 ALU 完成 一 次 正确 的 运 
算 ,寄存 需 间 的 一 次 传送 等 。 

由 于 不 同 的 机 器 周期 内 需要 完成 的 微 操 作 的 个 数 及 难 易 程度 是 不 同 的 ,因而 不 同 机 器 
周期 内 所 需要 的 节拍 数 也 不 相同 。 定 长 机 岩 周 期 以 最 复杂 的 机 融 周 期 为 准 来 定 出 节拍 数 ， 
每 一 节拍 时 间 的 长 短 也 以 最 移 的 微 操作 为 准 , 这 种 方法 使 得 所 有 的 机 器 周期 长 度 相 等 ,并 且 
每 一 机 融 周 期 内 含有 相同 数目 的 节拍 。 不 定 长 机 需 周 期 按照 实际 的 需要 安排 节拍 数 , 需 要 
多 少 个 市 担 就 提供 多 少 个 节拍 ,这 种 方式 的 时 间 利 用 率 高 。 还 有 一 种 方法 是 在 照顾 多 数 机 
需 周 期 要 求 的 前 提 下 ,选取 适当 的 节拍 数 作为 基本 节拍 , 耕 某 个 机 髓 周期 内 按 规 定 的 基本 节 
拍 数 无 法 完成 该 周期 的 全 部 微 操作 , 则 可 延长 节拍 。 

某 些微 型 机 的 时 序 信 号 中 不 设置 节拍 ,直接 使 用 时 钟 周 期 信号 。 一 个 机 硕 周期 中 含有 
右 干 个 时 钟 周 期 ,时 钟 周 期 的 数目 取决 于 机 器 周期 内 完成 微 操作 数目 的 多 少 以 及 相应 功能 
部 件 的 速度 。 一 个 机 天 周期 的 基本 时 钟 周 期 数 确 定之 后 ,还 可 以 不 断 搬 人 等 待 时 钟 周 期 ,如 
图 7-16 所 示 。 例 如 PC 系列 微机 的 一 个 总 线 周 期 ( 即 机 顶 周 期 ) 中 包 侣 了 4 个 基本 时 钟 周 期 
太一 全 ,在 T 和 TT 之 间 可 以 插入 硅 干 个 等 每 时 钟 周期 Tw 以 等 待 速度 较 慢 的 存储 部 件 或 
M( 机 器 周期 ) 


1 机 苘 问 期 ) 


到 7-16 时 钟 周期 的 插入 
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完成 读 , 写 操作 ， 
2. 工作 脉冲 


1/O 〇 设 乱 


通 稼 ,在 一 个 闻 拍 内 还 设置 一 个 或 几 个 具有 一 定 宽度 的 工作 脉冲 ,以 确保 触发 硕 可 靠 、 
稳定 地 翻转 。 在 节拍 中 执行 的 微 操作 .有些 需要 同步 定时 脉冲 ,如 将 稳定 的 运算 结果 打 人 寄 
人 存 谷 、 机 甫 周期 状态 切换 等 。 

般 小 型 机 中 篆 采 用 如 图 7-17 所 示 的 周期 - 广 招 -工作 脉冲 三 级 时 友和 系统 ,图 7-17 中 每 
个 机 器 周期 M 中 包括 4 个 节拍 五 一 五 ,每 个 贡 拍 内 有 一 个 工作 脉冲 P。 


图 7-17 周期 -节拍 -工作 脉冲 三 级 时 序 系统 
3. 节拍 脉冲 和 工作 脉冲 的 时 间 配 合 


在 时 序 系统 中 ,下 拍 脉 冲 和 工作 脉冲 所 起 
的 作用 是 不 同 的 , 太 提 脉冲 信号 在 数据 通路 传 
输 中 起 开门 、 关 门 的 控制 作用 , 套 信 息 的 载体 。 
而 工作 脉冲 则 作为 打 入 脉冲 ,作用 在 触发 右 的 
时 钟 脉冲 输入 端 ,起 定时 触发 作用 。 通 常 触发 
名 来 用 节拍 -脉冲 工作 方法 ,例如 对 于 DD 触发 需 ， 
则 节拍 脉冲 控制 信息 送 到 触发 右 的 DD 端 ,工作 脉 
冲 送 到 CP 端 ,它们 之 间 的 配合 关系 如 图 7-18 
所 示 。 


7.3.2 CPU 的 控制 方式 


一 条 指令 的 执行 是 由 许多 微 操 作 组 成 的 ,不 同 的 指令 对 应 着 不 同 的 微 操作 序列 。 控 制 
售 控 制 指 人 的 执行 过 程 是 依次 执行 一 个 确定 的 微 操作 序列 的 过 各 由 于 不 同 的 机 需 指 令 所 
对 应 的 微 操 作 厅 列 的 长 短 和 索 简 程度 各 不 相同 ,所 以 执行 每 条 指令 所 需 的 时 间 也 不 相等 ,这 
就 存在 着 用 何 种 时 序 方 式 来 形成 微 操作 序列 的 问题 。 形 成 微 操作 序列 的 时 序 方式 称 为 控制 
方式 , 它 不 仅 直 接 决 定 着 微 操 作 控 制 信号 的 产生 ,也 影响 到 控制 类 和 其 他 部 件 的 组 成 以 及 指 
令 的 执行 速度 等 。 和 常用 的 控制 方式 有 同步 控制 方式 .异步 控制 方式 和 联合 控制 方式 等 。 


数据 ”节拍 脉冲 7 打 入 条 件 工作 脉冲 PD 
图 7-18 节拍 脉冲 和 工作 脉冲 的 配合 关系 
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1. 同步 控制 方式 


所 谓 同 步 控 制 方式 是 指 系 统 有 一 个 统一 的 时 钟 , 所 有 的 控制 信号 均 来 自 这 个 统一 的 时 
钟 信号 。 同 步 控制 方式 亦 称 为 固定 时 序 控制 方式 ,其 基本 思想 是 选取 部 件 中 最 长 的 操作 时 
间作 为 统一 的 时 间 间 隅 标准 ,使 所 有 的 部 件 都 在 这 个 时 间 间 隔 内 局 动 并 完成 操作 。 通 篆 采 
用 同步 的 时 序 发 生 髓 ,产生 固定 的 周而复始 的 机 器 周期 电位 .节拍 脉 冲 , 用 统一 的 时 序 信号， 
定时 各 种 操作 ,实现 同步 控制 。 

根据 指令 周期 \ 机 和 磊 周 期 和 市 招 的 长 度 固 定 与 耕 , 同 步 控制 方式 又 可 分 为 以 下 几 种 。 

(1) 定 长 指令 周期 : 即 所 有 指令 的 执行 时 间 都 相等 。 在 指令 的 繁 简 差异 很 大 ,规定 统 
一 的 指令 周期 ,无 疑 会 造成 太 多 的 时 间 沪 费 。 因 此 , 定 长 指令 周期 的 方式 很 少 被 采用 。 

(2) 定 长 机 需 周 期 : 这 种 方式 中 各 个 机 需 周 期 都 相等 ,一 般 都 等 于 主 存 的 存 取 周期 。 
而 指令 周期 不 国定 ,等 于 机 需 周 期 的 整数 倍 。 

(3) 变 长 机 需 周 期 . 定 长 节拍 : 这 种 方式 的 指令 周期 长 度 不 固定 ,而 且 机 更 周期 长 度 也 
不 固定 ,其 含有 的 方 拍 数 根 据 需 要 而 定 , 与 主 存 存 取 周期 和 总线 周 期 没有 固定 关系 。 这 种 控 
制 方式 根据 指令 的 具体 要 求 和 执行 步骤 ,确定 安排 哪 几 个 机 絮 周 期 ,以 及 每 个 机 占 周 期 中 安 
排 多 少 个 节拍 和 工作 脉冲 ,因此 不 会 造成 时 间 浪 费 ; 但 时 序 系统 的 控制 比较 复杂 ,要 根据 不 
同情 况 确 定 每 个 机 需 周 期 的 节拍 数 。 

CPU 内 部 操作 均 采 用 同步 控制 ,其 原因 是 同一 忆 片 的 材料 相同 .工作 速度 相同 , 片 内 传 
输 线 短 ,又 有 共同 的 脉冲 源 , 所 以 采用 同步 控制 方式 。 

同步 控制 方式 中 ,各 条 指令 所 需 的 时 序 由 控制 大 统一 发 出 ,所 有 微 操 作者 与 时 钟 同步 ， 
所 以 又 称 为 集中 控制 方式 或 中 央 探 制 方式 。 同 步 控 制 方式 的 优点 是 时 序 关 系 比 较 简 单 , 控 
制 句 设计 方便 。 但 对 简单 的 指令 会 产生 空闲 时 间 ,降低 了 指令 的 执行 速度 。 


2. 异步 控制 方式 


异步 控制 方式 即 可 变 时 序 控制 方式 ,各 项 操作 不 采用 统一 的 时 序 信 号 控制 ,而 根据 指令 
或 部 件 的 具体 情况 决定 ,需要 多 少时 间 , 就 占用 多 少时 间 。 

如 图 7-19 所 示 的 是 一 种 采用 “应 答 通 信 ” 实 现 的 控制 方式 ,各 操作 之 间 的 衔接 是 由 “ 结 
束 -启动 ”信和 号 来 实现 的 。 由 前 一 项 操作 已 经 完成 的 “结束 ”信和 号 ,或 由 “准备 好 ”信号 来 作为 
下 一 项 操作 的 启动 信号 ,在 未 收 到 “结束 ”或 “准备 好 ”信号 之 前 不 开始 新 的 操作 。 例 如 ,存储 
需 读 操作 时 ,CPU 癌 存储 右 发 一 个 读 命 令 ( 启 动 信号 ) ,局 动 存储 器 内 部 的 时 序 信 号 ,以 控制 
存储 问讯 操作 ,此 时 CPU 处 于 等 待 状态 。 当 存储 豆 操 作 结 束 后 ,存储 天 加 CPU 发 出 MFC 
(结束 信号 ) ,以 此 作为 下 一 项 操作 的 起 始 信和 号。 


结束 - 
部 件 A 了 | 局 


部 件 B 


部 件 C 


254 


MM 


7.4 控制 部 件 的 
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异步 控制 方式 采用 不 同时 订 ,没有 时 间 上 的 混 费 ,因而 提高 了 机 策 的 效率 ,但 是 控制 比 
较 复 淋 。 由 于 这 种 控制 方式 没有 统一 的 时 钟 ,而 是 由 各 功能 部 件 本 号 产生 各 日 的 时 序 信号 
进行 日 我 控制 的 , 故 又 称 为 分 散 控 制 方式 或 局 部 控制 方式 。 


3. 联合 控制 方式 


CPU 内 部 的 操作 采用 同步 方式 ,CPU 与 主 存 和 1/O 设备 的 操作 采用 异步 方式 ,这 就 市 
来 了 一 个 同步 方式 与 异步 方式 如 何 过 渡 、 衔 接 的 问题 。 也 就 是 说 ,当主 存 或 IO 设备 的 
Ready 信号 到 达 CPU 时 ,不 可 能 恰好 为 CPU 脉冲 源 的 整 周 期 或 和 节拍 的 整 周 期 。 解 决 方法 
是 一 种 折 中 方案 , 即 联合 控制 方式 。 

联合 控制 方式 是 同步 控制 和 异步 控制 相 结 合 的 方式 。 现 代 计 算 机 中 几乎 没有 完全 米 用 
同步 或 异步 的 控制 方式 ,多 数 是 米 用 联合 控制 方式 。 通 党 的 设计 思想 是 在 功能 部 件 内 部 来 
用 同步 方式 或 以 同步 方式 为 主 的 控制 方式 ,在 功能 部 件 之 间 采 用 异步 方式 。 

联合 控制 方式 是 介 于 同步 和 异步 之 加 的 一 种 折 中 。 对 大 多 数 需 要 贡 拍 数 相 近 的 指令 ， 
用 相同 的 节拍 数 来 完成 , 即 采 用 同步 控制 ; 而 对 少数 需要 节拍 数 多 的 指令 或 节拍 数 不 固定 
的 指令 ,给 予 必要 的 延长 , 即 采 用 异步 控制 。 联 合 控制 方式 中 ,CPU 内 部 基本 时 序 采 用 同步 
方式 , 当 CPU 通过 和 总线 与 主 存 或 其 他 LO 设备 交换 数据 时 ,就 转 入 异步 方式 。CPU 只 需 给 
出 局 动 信号 , 主 存 和 I/O 设备 按 日 己 的 时 友信 和 号 去 安排 操作 ,一 旦 操作 结束 , 则 癌 CPU 发 
送 结 束 信 号 ,以 便 CPU 再 安排 它 的 后 继 工 作 。CPU 并 不 是 在 任何 时 刻 就 能 立即 对 来 自主 
存 和 I/O 接口 的 请 求 信号 做 出 反应 的 ,而 是 在 一 个 市 招 周 期 的 结束 (下 一 个 布 拍 周期 的 开 
始 )。 也 就 是 说 , 当 CPU 进行 主 存 的 谈 与 操作 或 进行 IO 设备 的 数据 传输 时 ,是 按 同 步 方 
式 插 入 一 个 节拍 或 几 个 节拍 ,直到 主 存 或 1/O 设备 的 结束 信和 号 到 达 为 止 。 联 合 控制 方式 是 
CPU 进行 主 存 的 读 写 操作 和 1/O 数据 传输 操作 时 通常 米 用 的 方式 ,能 较 好 地 解决 同步 与 寞 
步 的 衔接 问题 ，。 


布线 实现 


通过 以 上 几 节 内 容 的 介绍 ,已 建立 起 了 整 机 的 概念 。 控 制 器 是 计算 机 中 发 布 命令 的 " 决 
策 机 构 ”, 由 程序 计数 器 (PC) .指令 寄存 器 (IR) .指令 译 码 器 .地 址 译 码 器 .时 序 发 生 器 和 操 
作 控 制 器 组 成 。 操 作 控 制 器 根据 指令 操作 码 和 时 序 信号 ,产生 各 种 微 操 作 控 制 信号 ,用 以 控 
制 计算 机 各 部 分 的 操作 , 它 是 整个 控制 右 的 核心 。 

硬 布线 控制 器 是 早期 计算 机 的 一 种 设计 方 ; 


这 种 方法 是 将 控制 部 件 做 成 产生 固定 时 
序 控制 信号 的 逻辑 电路 ,该 逻辑 电路 是 由 门 电路 和 触发 右 构 成 的 复杂 树 状 网 络 , 所 以 称 为 硬 
布线 控制 器 ,由 于 微 操 作 控制 信号 序列 是 硬 布线 控制 器 中 的 组 合 逻 辑 网 络 产生 的 ,因而 又 称 
为 组 合 逻 辑 控制 器 。 随 着 大 规模 集成 电路 制造 技术 的 发 展 ,使 用 通用 可 编程 逻辑 器 件 设 计 
控制 紫 , 这 种 方式 实现 的 控制 器 称 为 门 阵列 控制 器 ; 微 操作 控制 信号 序列 也 可 用 微 程 序 产 
生 , 用 这 种 方式 实现 的 控制 器 称 为 微 程序 控制 右 , 这 部 分 内 容 将 在 7.5 节 介 绍 。 

对 实际 使 用 的 计算 机 ,其 控制 器 的 组 成 是 很 复杂 的 。 在 本 节 介 绍 硬 布线 控制 器 设计 时 ， 
采取 了 一 种 较为 简单 的 机 器 组 成 结构 , 略 去 了 许多 烦琐 的 细节 ,重点 突出 控制 器 的 设计 思路 
及 要 点 ,以 加 深 读者 对 整 机 概念 及 其 工作 原理 的 认识 与 掌握 。 
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7.4.1 硬 布线 控制 希 的 基本 原 焉 


硬 布 线 控制 器 主要 由 组 合 逻 辑 网 络 .指令 寄存 器 、 指 令 译 码 器 和 节拍 电位 /节拍 脉冲 发 
生 器 等 部 分 组 成 ,由 门 电 路 和 触发 器 构成 的 复杂 树 状 网 络 实现 , 它 以 使 用 最 少 元 件 和 取得 最 
高 操作 速度 为 设计 目标 。 

硬 布线 控制 器 的 结构 方 框图 如 图 7-20 所 示 ,其 中 组 合 逻 辑 网 络 产生 计算 机 所 需 的 全 部 
微 操作 命令 ,是 控制 器 的 核心 。 


微 捍 作 控 制 信号 友 而 
C, 


组 合 逻辑 网 络 的 输入 信号 来 源 有 三 个 : 

(1) 来 和 目 指令 操作 码 译 码 器 的 输出 五 一 玉 , 译 码 需 每 根 输出 线 表示 一 条 指令 , 译 码 顺 的 
输出 反映 出 当前 正在 执行 的 指令 ; 

(2) 来 日 执行 部 件 的 反馈 信息 Bi 一 已;; 

(3) 来 和 目 时序 产生 天 的 时 序 信 号, 包括 节拍 电位 信号 Mi 一 M 和 节拍 脉冲 信号 了 一 
T;。 其 中 节拍 电位 信号 是 机 占 周 期 (CPU 周期 ) 信 号 ,节拍 脉冲 信号 是 时 钟 周 期 信号 。 组 合 
逻辑 网 络 N 的 输出 信号 就 是 征 操 作 控制 信号 Ci 一 C, ,用 来 对 执行 部 件 进行 控制 。 另 有 一 些 
信号 则 根据 条 件 变 量 来 改变 时 序 发 生 辫 的 计数 顺序 ,以便 跳 过 某 些 状态 ,从 而 可 以 出 短 指 令 
周期 。 

人 硬 布 线 控 制 器 的 基本 原理 ,归纳 起 来 可 叙述 为 : 某 一 微 操作 控制 信号 C, 是 指令 操作 三 
泽 人 码 大 输 出 了 工 , ;时序 信号 (节拍 电位 M;, 广 拍 脉 冲 T,) 和 状态 条 件 信 号 B; 的 逻辑 图 数 , 其 数 
学 描述 为 


C, = f(T,,M.,,T,,B,) 

控制 信号 C, 是 用 门 电路 .触发 器 等 许多 器 件 采用 布尔 代数 方法 来 设计 实现 的 。 当 机 器 
加 电工 作 时 , 某 一 操作 控制 信号 C, 在 某 条 特定 指令 和 状态 条 件 下 ,在 某 一 操作 的 特定 节拍 
电位 和 节拍 脉冲 时 间 间 隔 中 起 作用 ,从 而 激活 这 条 扫 
然 , 从 指令 流程 图 出 发 ,就 可 以 一 个 不 漏 地 确定 在 指令 周期 中 各 个 时 刻 必 须 激活 的 所 有 操作 
控制 信号 。 例 如 ,对 引起 一 次 主 存 读 操作 的 控制 信号 C; 来 说 , 当 节拍 电位 M, 二 1, 取 指令 时 
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被 激活 ; 而 节拍 电位 M4 二 1, 三 条 指令 (LDA、ADD、SUB) 取 操作 数 时 也 被 激活 ,此 时 指令 
泽 码 器 的 LDA ,ADD、SUB 输出 均 为 1, 因 此 C; 的 逻辑 表达 式 可 由 下 式 确定 : 
C: = Mi + Mi (LDA + ADD+ SUB) 
一 般 来 说 ,还 要 考虑 节拍 脉冲 和 状态 条 件 的 约束 ,所 以 每 一 控制 信号 C, 可 以 由 以 下 形 
式 的 布尔 代数 表达 式 来 确定 : 


( 和 > |w . 了 了 已 ; D1. | 


7.4.2 硬 布线 控制 帝 议 计 兴 例 


一 人 台 实 际 机 融 的 控制 部 件 是 非常 复杂 的 ,是 有 几 百 条 输出 控制 线 的 逻辑 网 络 ,不 可 能 在 
书 中 作 话 细 的 描述 与 设计 。 以 最 简单 的 模型 机 为 实例 ,来 讨论 其 设计 的 方法 和 步骤 。 

在 这 里 仍 以 图 7-1 作为 模型 机 。 图 中 包含 了 各 种 部 件 设 置 以 及 它们 之 间 的 数据 通路 结 
构 。 在 数据 通路 结构 的 基础 上 ,就 可 拟 出 各 种 信息 传送 路 径 , 以 及 为 实现 这 些 传送 所 知 的 微 
操作 控制 信和 号。 

假设 模型 机 的 指令 系统 只 包括 4 条 典型 的 指令 ,如 表 7-2 所 示 。 

表 7-2 模型 机 的 指令 系统 

助 记 符 操作 描述 与 功能 说 阴 
LDA n AC<—n, 把 立即 数 n 传送 给 累加 寄存 器 AC 
ADD [X] AC<—(AC) 十 (X) ,AC 的 内 容 与 存储 单元 X 的 内 容 相 加 送 AC 
STR [X] X<-(AC),AC 的 内 容 存 人 存储 单元 X 
JMP X PC< -X, 实 现 转移 


(1) 根据 CPU 数据 通路 和 指令 功能 ,排列 出 每 条 指令 的 微 操 作 控 制 序 列 。 把 表 7-2 
的 4 条 典型 指令 加 以 归纳 , 画 出 如 图 7-21 所 示 的 指令 流程 。 


AR—PC, PC+1; "7 
ABUS—AR: RD: 刀 


Mi DR—DBUS: 7T, 
[R=—DR: T, 


LDA ADD STR IMP 


AR—IR: 7, 
DR 二 [Ri ARIR:; 7 DR AC: I 
ALU 一 DR: T, ABUS=—AR, RD: 7, ABUS< AR: 7, 
M, AL 一 ALU; 7; DR—DBUS; 1; DBUS—DR, WR: T, 


Ni 7 


ALU—DR, ALU< A 
M; it; 1) 
AC—ALU; 1; 


图 7-21 指令 流程 及 节拍 分 配 
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由 图 7-21 可 知 , 所 有 指令 的 取 指 阶段 都 放 在 Mi 节拍 。 在 此 节拍 中 ,操作 控制 器 发 出 
微 操作 控制 信号 ,完成 从 内 存 取出 一 条 机 硕 指 令 。 

指令 的 执行 阶段 由 M;、Ms 两 个 节拍 完成 。LDA 、STR 和 JMP 指令 只 要 一 个 节拍 
(M;) 即 可 完成 ,ADD 指令 需要 两 个 节拍 CM ,Ms)。 为 了 简化 节拍 控制 ,指令 的 执行 过 程 可 
采用 同步 控制 方式 , 即 各 条 指令 的 执行 阶段 均 用 最 长 节拍 数 M; 来 考虑 。 这 样 ,对 LDA、 
STR 和 JMP 指令 来 说 ,在 M; 太 拍 没有 什么 操作 。 因 此 ,同步 控制 方式 虽然 简化 了 市 拍 控 
制 ,但 是 ,对 于 短 指令 来 说 ,造成 了 时 间 上 的 浪费 ,降低 了 CPU 的 指令 执行 速度 。 在 实际 的 
机 顺 中 ,在 设计 得 指 令 流 程 时 可 以 跳 过 某 些 节拍 。 当 然 在 这 种 情况 下 ,节拍 信号 发 生 需 的 电 
路 要 复杂 一 些 。 

(2) 微 操 作 控 制 信 号 逻辑 条 件 的 综合 与 化 简 。 

根据 第 (1) 步 列 出 的 全 部 操作 时 间 表 ,可 列 出 全 机 在 各 种 工作 状态 下 所 需 的 所 有 微 操作 
控制 信号 ,对 于 可 以 合并 的 微 操作 控制 信号 予以 合并 与 简化 。 为 了 化 简 , 常 将 周期 电位 、 节 
拍 等 时 间 条 件 , 以 及 操作 码 、 寻 址 方式 、 寄 存 絮 号 等 逻辑 条 件 综 合 为 一 些 中 间 逻 辑 变 量 供 使 
用 。 组 合 逻辑 电路 的 输出 是 所 需 的 微 操作 控制 信号 ,可 分 为 维持 一 个 时 钟 周 期 宽 的 电位 型 
微 操 作 控 制 信号 ,或 是 短暂 的 、 靠 边沿 作用 的 脉冲 型 微 操 作 控制 信号 。 

设 每 一 个 节拍 电位 中 又 由 4 个 市 拍 脉冲 组 成 ,分 别 为 TI、T;、T;、T ,下面 列 出 模型 机 
微 操作 控制 信号 的 逻辑 表达 式 并 加 以 简化 : 

AR<-PC 一 M 。T ; 

PC 十 1 一 M .TT,; 

ABUS<—-AR=M, .T 十 MCADD . T 十 STR . T,); 

RD = (M+ADD. M,) T,; 

DR<—DBUS= (M+ ADD: M,) T,; 

IR<-DR=M, . T,; 

DR<—IR=LDA . M, » Ti; 

AR<IR= (ADD+STR). M, .TT,; 

PC<IR=JMP. M,. T; 

ALU<-DR=LDA.M, .T 十 ADD .M， . T; 

DR<—AC=STR* M，.。T， ; 

AM 一 LDA 。 M,.， T.,; 

AC<—ALU= (LDA . M, 十 ADD . M;)T,; 

DBUS<-DR 一 STR 。M: .了 T, ; 

WR=STR* M,. T,; 

ALU<—AC=ADD. M; .TT,; 

十 一 ADD .。 M; ， T,; 

要 说 明 的 是 : 在 上 述 逻 辑 表 达 式 中 ,假定 每 个 微 操 作 控 制 信号 都 是 持续 一 个 节 提 脉冲， 
即 一 个 时 钟 周 期 的 时 间 ,这 样 简 化 问题 。 而 实际 的 机 需 中 各 个 微 操 作 控 制 信号 持续 节拍 脉 
冲 数 是 不 同 的 。 

(3) 微 操作 控制 信号 的 逻辑 实现 。 

传统 的 方法 是 直接 用 门 电路 实现 上 述 逻 辑 表达 式 , 这 一 组 电路 就 这 称 为 微 操作 控制 信 
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Ke 


号 发 生 表 ,它们 是 控制 颖 的 主要 实体 。 下 面 给 出 产生 微 操作 控制 信号 ABUS<- AR 组合 逻 
辑 电 路 如 图 7-22 所 示 [ABUS<AR= M 。T 十 MCADD .T, 十 STR.T,)]。 


ADD 


ABUS—AR 


图 7-22 产生 微 操作 控制 信号 ABUS< AR 组 合 逻 辑 电路 


图 7-22 中 M 、M;、T;、T， 是 时 序 产生 器 的 输出 ,ADD、STR 是 指令 译 码 器 的 输出 ,它们 
是 组 合 逻 辑 网 络 的 输入 ,产生 的 输出 是 微 操 作 控 制 信号 ABUS<-AR, 其 他 的 微 操作 控制 信 
号 也 可 以 按 类 似 的 方法 产生 ,在 此 不 一 一 画 出 。 产 生 所 有 微 操作 控制 信 叶 的 逻辑 电路 构成 
了 一 个 复杂 的 组 合 逻 辑 网 络 。 一 台 计 算 机 所 需 的 微 操 作 控制 信号 可 能 有 成 百 上 千 , 因 此 硬 
布线 控制 器 中 的 微 操 作 控 制 信号 产生 器 ,实际 上 是 一 组 不 规整 的 组 合 逻 辑 电路 , 即 门 电路 
集合 。 

随 着 大 规模 集成 电路 制造 技术 的 发 展 , 现 在 广泛 采用 可 编程 门 阵列 来 实现 控制 器 ,或 者 
& 量 用 门 阵列 产生 大 部 分 微 操作 控制 信号 ,使 电路 结构 得 到 简化。 产生 微 操作 控制 信号 的 
各 种 逻辑 条 件 作 为 门 阵列 的 输入 ,人 蕊 片 内 部 产生 相关 的 译 码 输出 ,再 经 编码 形成 千 干 微 操 作 
控制 信号 输出 。 这 种 多 输入 一 一 多 输出 组 合 逻 辑 很 适合 构成 微 操作 控制 信号 发 生 器 。 

(4) 硬 布 线 控制 需 逻 辑 设计 中 的 注意 事项 。 

综 上 所 述 , 硬 布线 控制 器 的 设计 是 用 大 量 的 逻辑 门 电路 , 按 一 定 规则 组 合成 一 个 逻辑 网 
络 , 从 而 产生 各 机 天 指令 的 微 操作 控制 信号 序列 ,其 设计 过 程 一 般 经 历 下 列 步骤 : 

D 根据 给 定 的 CPU 数据 通路 和 指令 功能 ,排列 出 每 条 指令 的 微 操作 控制 序列 。 

确定 机 器 的 状态 周期 .节拍 与 工作 脉冲 。 根 据 指 令 的 功能 和 般 件 的 速度 ,确定 指令 
执行 过 程 中 的 周期 及 节拍 的 基本 时 间 。 

列 出 每 个 微 操 作 控 制 信号 的 逻辑 表达 式 。 确 定 了 每 条 指令 在 每 一 状态 周期 中 各 个 
节拍 内 所 完成 的 操作 ,也 就 得 出 了 相应 的 操作 控制 信号 的 表达 式 。 该 表达 式 由 指令 操作 但 、 
时 序 状 态 ( 周 期 .节拍 和 工作 脉冲 ) 以 及 状态 条 件 信 息 ( 人 允许 有 空缺 ) 等 因子 组 成 。 

进行 指令 综合 。 综 合 所 有 指令 的 每 一 个 操作 命令 , 写 出 逻辑 表达 式 , 并 进行 化 人 简 。 

逻辑 电路 设计 。 合 理 选 用 逻辑 门 电 路 ,将 简化 后 的 逻辑 表达 式 用 组 合 逻辑 电路 来 
实现 。 

总 之 ,控制 信和 号 的 设计 与 实现 ,技巧 性 较 强 ,目前 已 有 一 些 专 门 的 开发 系统 
辑 设 计 使 用 ,但 是 ,对 全 局 的 考虑 主要 依靠 设计 人 员 的 智慧 和 经 验 。 


7.4.3 硬 布 线 控制 帝 的 机 总 及 其 改 j 
地 介绍 了 硬 布线 控制 器 的 设计 之 后 ,将 会 发 现 硬 布线 控制 方式 的 缺点 ,并 找 


或 工具 供 逻 


在 比较 完 3 
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到 相应 的 改进 方向 。 

(1) 如 前 所 述 , 便 布线 控制 方式 是 用 许多 门 电路 产生 微 操 作 控 制 信号 的 ,而 这 些 门 电路 
所 需 的 人 逻辑 形态 很 不 规整 ,因此 人 硬 布 线 控制 占 的 核心 部 分 比较 烦 珊 、 笑 乱 ,设计 效率 较 低 , 检 
查 调 试 困 难 。 就 其 设计 方法 而 言 , 虽 有 一 定 的 规律 ,但 对 于 不 同 的 指令 与 不 同 的 安排 ,所 构 
成 的 微 操作 控制 信号 形成 的 电路 也 就 不 同 。 改 进 的 方 回 是 将 程序 设计 技术 引 和 人 CPU 机 着 
的 构成 级 ,使 设计 规整 化 ,也 就 是 像 编制 程序 那 梓 去 编制 微 操 作 欣 制 信号 序列 。 

(2) 便 布 线 控制 方式 的 万 一 缺点 是 不 匈 收 改 或 扩展 。 这 是 因为 设计 结果 用 印刷 电路 板 
( 硬 布线 ) 固 定 下 来 以 后 ,就 很 难 再 修改 与 扩展 了 。 而 且 , 在 各 个 微 操 作 控制 信号 逻辑 表达 式 
中 往往 包含 着 许多 条 件 ,其 中 一 些 逻 辑 变量 可 能 是 其 他 微 操 作 控 制 信号 所 公用 的 ,修改 一 处 
就 会 牵动 其 他 ,因而 很 难 改动 。 机 天 一 旦 设计 并 制造 出 来 ,要 想 修 改 其 操作 过 程 或 某 些 操作 
的 处 理 方式 ,或 进一步 修改 与 扩充 指令 系统 ,基本 上 是 不 可 能 的 。 这 就 使 一 台新 设计 的 机 器 
可 能 难以 达到 理想 的 效果 ; 如 果 推 出 一 种 新 的 指令 系统 , 原 有 的 机 融 就 不 能 执行 它 。 改 进 
的 方向 是 将 存储 逻辑 引入 CPU ,取代 组 合 逻 辑 的 微 操 作 控 制 信号 发 生 需 ,也 就 是 将 微 操 作 
控制 信号 作为 数字 代码 直接 存 人 一 个 存储 闫 中 ,只 要 修改 所 存储 微 操 作 控 制 信号 的 代码 ,就 
可 修改 有 关 的 功能 与 执行 的 方式 。 

这 两 种 改进 方 回 导致 了 微 程序 控制 思想 的 出 现 , 但 组 合 逻 辑 控制 方式 仍 是 产生 控制 命 
令 的 一 种 基本 方式 ,即使 来 用 微 程 序 控制 后 , 仍 有 部 分 微 操 作 控 制 信 号 需要 组 合 逻 辑 电 路 产 
生 。 组 合 逻 辑 控制 方式 的 优点 是 速度 较 快 ,因此 目前 主要 应 用 于 高 速 计算 机 ,如 RISC 处 理 


微 程序 控制 器 


亲 面 讲 过 ,在 计算 机 系统 中 ,控制 各 第 第 米 用 便 布 线 设计 搁 术 和 微 程序 设计 技术 , 微 程 
序 控制 设计 技术 是 利用 软件 方法 进行 硬件 设计 的 一 门 技术 。 本 节 将 重点 介绍 微 程序 控 
制作 。 

时 在 1951 年 蝎 轩 剑桥 大 学 的 M. V. Wilkes 教授 就 提出 了 微 程序 控制 的 思 相 ,他 认为 
每 条 机 天 指令 都 可 以 分 解 为 奋 干 基本 的 操作 序列 , 故 一 旦 机 上 需 的 体系 结构 和 指令 系统 确定 
后 ,计算 机 所 需要 的 全 部 操作 控制 信号 也 就 确定 了 ,可 将 这 些 操作 信和 号 以 微 码 的 形式 编制 成 
微 指令 , 微 指令 中 的 每 个 二 进 制 位 定义 成 相应 的 控制 码 位 ,该 位 为 1, 表示 执行 该 操作 ,该 位 
为 0, 表示 不 执行 该 操作 。 这 样 ,一 条 机 需 指 令 的 执行 可 通过 执行 大 干 条 微 指令 (这 些微 指 
令 的 集合 叫做 微 程序 ) 来 实现 。 指 令 系 统 确定 后 ,可 将 各 条 机 需 指 令 对 应 的 微 程 序 集中 存放 
到 一 个 只 读 存 储 融 中 ( 即 控 制 存 储 天 ,人 徐 称 控 存 ) ,因此 , 控 存 实际 上 成 了 一 个 微 操 作 控 制 信 

微 程序 控制 器 的 基本 设计 思想 概括 起 来 有 以 下 两 点 : 

(1) 将 指令 周期 中 所 需 的 微 操 作 控 制 信和 号 ,以 代码 ( 微 码 ) 形 式 编 成 微 指令 , 存 和 人 一 个 用 
ROM 构成 的 控制 存储 右 中 。 在 CPU 执行 程序 时 ,从 控制 存储 融 中 取出 微 指 令 , 其 所 包含 
的 微 命令 控制 有 关 操 作 。 与 硬 布 线 控制 方式 不 同 , 它 由 存储 逻辑 事先 存储 与 提供 微 命令 。 
这 体现 了 7.4 节 提出 的 一 种 改进 方 回 ee 

(2) 将 各 种 机 和 帮 指 令 的 操作 分 解 为 右 干 微 操 作 友 列 。 每 条 微 指 令 包 含 的 微 命 令 控制 实 
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现 一 步 操作 ,者 干 条 微 指令 组 成 一 段 微 程序 ,解释 执行 一 条 机 需 指 令 。 针 对 整个 指令 系统 的 
需要 ,编制 出 一 套 完 整 的 微 程 序 , 事 先 存 人 控制 存储 嘎 中 。 这 体现 了 又 一 种 改进 方向 ,利用 
程序 设计 技术 去 编排 指令 的 解释 与 执行 。 

上 面 从 两 个 角度 前 明了 微 程序 控制 的 基本 概念 : 微 操作 控制 信号 的 产生 方式 , 微 程序 
与 机 器 指令 之 间 的 对 应 关系 。 

上 面 所 述 涉及 了 两 个 层次 ,读者 务必 分 清 : 

一 个 层次 是 程序 员 看 到 的 传统 机 器 级 一 一 机 器 指令 。 机 器 指令 是 提供 给 使 用 者 编程 的 
基本 单位 , 它 表明 CPU 所 能 完成 的 基本 功能 。 程 序 员 根据 某 项 任务 编制 的 工作 程序 ,存放 
储 毅 中 ,最终 成 为 可 执行 的 指令 序列 ,由 程序 计数 需 (PC) 指 示 甚 流程 。 

aa 微 指 令 是 为 实现 机 器 指令 中 一 步 操 
vp 令 组 合 , 它 作为 CPU 内 部 的 控制 信息 ,通常 不 提供 给 使 用 者 ,对 程序 员 是 透明 的 。 
基 程 序 是 机 器 设 考生 天壤 抽 好 的 .作为 解 天 共 本 工作 程序 的 一 种 硬件 (固件 ) 手 段 ,在 制造 
CPU 时 就 存 人 控制 存储 冀 中 ，。 

工作 程序 可 以 很 长 ,如 几 和 干 条 指令 ,但 所 使 用 的 机 帮 指 令 类 型 有 限 , 所 对 应 的 微 程 序 也 
是 有 限 的 。 


7.5.1 微 程序 控制 的 基本 概念 


， 微 命 


一 台数 字 计 算 机 基本 上 可 以 划分 为 两 大 部 分 至 制 部 件 和 执行 部 件 。 控 制 希 就 是 探 
制 部 件 ,而 运算 羡 、 存储 硕 、 外围 设备 相对 控制 大 来 讲 ， 就 是 执 和 J 了 部件。 那么 两 者 之 间 是 怎样 
进行 联系 的 呢 ? 

控制 部 件 与 执行 部 件 的 一 种 联系 是 控制 信息 。 控 制 部 件 通 过 控制 线 向 执行 部 件 发 出 各 
种 控制 命令 , 通 第 把 这 种 控制 命令 叫做 微 命令 ,而 执 本 部 件 接 受 微 命令 后 所 进行 的 操作 就 是 
微 操 作 。 

控制 部 件 与 执行 部 件 之 间 的 另 一 种 联系 是 反馈 信息 。 执 行 部 件 通过 反馈 线 回 控制 部 件 
反映 操作 和 情况, 以便 控制 部 件 根 据 执 : 行 部 件 的 “状态 ”下 达 新 的 微 命令 ,这 也 叫做 “状态 
测试 ”。 

微 操 作 在 执行 部 件 中 是 最 基本 的 操作 。 由 于 数据 通路 的 结构 关系 , 微 操作 可 分 为 相 容 
性 和 相 斥 性 两 种 。 所 谓 相 容 微 操作 ,是 指 同 时 或 同一 个 微 指 令 周 期 内 可 以 并 行 执 行 的 微 操 
作 。 所 谓 相 斥 微 操作 ,是 指 不 能 同时 或 不 能 在 同一 个 微 指 令 周 期 内 并 行 执行 的 微 操作 

为 了 说 明 微 程序 控制 器 的 工作 原理 ,将 CPU 简化 为 图 7-23。 其 中 ALU 为 算术 逻辑 单 
元 ,AC 为 累加 寄存 器 ,DR 为 数据 寄存 器 。AC、DR 寄存 器 的 内 容 都 可 以 送 至 ALU 输入 
端 ,而 ALU 的 输出 可 以 送 往 AC。 在 给 定 的 数据 通路 中 ,每 个 控制 门 仅 是 一 个 常 闭 的 开关 ， 
它 的 一 个 输入 端 代表 来 自 寄存 带 的 信息 ,而 男 一 个 输入 端 则 作为 操作 控制 端 。 一 旦 两 个 输 
和信 问 都 有 输入 信号 时 , 它 才 产生 一 个 输出 信号 ,从 而 在 控制 信号 能 起 作用 的 一 个 时 间 宽 度 中 
使 信息 在 部 件 之 间 流 动 。 

图 7-23 中 每 个 开关 由 控制 禹 中 相应 的 微 命令 来 控制 。 假 定 ALU 只 有 加 \ 减 传送 三 种 
操作 ,分 别 由 Ci .Cs .Cs 微 命 令 来 控制 ,这 三 种 操作 在 同一 个 CPU 周期 中 员 1 能 选择 一 种 ,不 
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vd 


Cl C2 0 CC; Cy 算命 令 说 明 

| Li Cl: AC(AC}H(DR) 
Co’: AC(AC})(DR) 
C3: AL 一 ALU 一 DR 


人 程序 C,: RDM., DR -一 MU(AR) 
控制 苗 Cs: MU(AR) 一 DR WR M 


Co: DR 一 AL 

Cj: AC—DR 

Cs: DR<IR(ADR) 
Co: AR—IR(ADR) 
Co: PC—IR(ADR) 
Ci: PC+] 

C1: AR 一 PC 

Ca: I =— DD 


图 7-23 简化 的 CPU 


能 并 行 , 所 以 加 、 减 ,传送 三 个 微 操 作 是 相 斥 性 的 微 操作 。AC==0 为 去 标志 触发 需 , 运 算 结 
果 为 零 时 该 触发 需 状 态 为 "17?。 类 似 地 ,C .Ci 分 别 是 存储 需 读 、 写 微 命 令 ,它们 控制 的 存储 
需 读 、 写 微 操作 是 相 斥 性 的 ,Ce 、C;i 控制 的 微 操 作 也 是 相 斥 性。Ca Ca .Cs 控制 的 微 操 作 可 
以 在 同一 个 微 指令 周期 中 进行 ,所 以 是 相 容 性 的 微 操作 。 


2. 微 指 令 和 微 程 序 


在 机 器 的 一 个 CPU 周期 中 ,一 组 实现 一 定 操作 功能 的 微 命 令 的 组 合 , 构 成 一 条 微 指 
令 。 以 图 7-23 所 示 简 化 的 CPU 内 的 数据 通路 为 例 , 图 7-24 表示 一 个 具体 的 微 指令 结构 ， 
微 指 令 字 长 为 19 位 , 它 由 操作 控制 字段 和 顺序 控制 字段 两 大 部 分 组 成 。 


LI (LI C3 (L4 Cs Ce C7 Cs Co Co Cu (LI C1 P| 了 2 下 接地 址 


操作 控制 字段 顺序 控制 字段 


图 7-24 微 指 令 的 基本 格式 


1) 操作 控制 字段 


时 作 控 制 字段 用 来 发 出 控制 和 指挥 全 机 工作 的 控制 信号 。 如 图 7-24 所 示 的 微 指令 中 ， 

该 操作 控制 字段 为 13 位 ,每 一 位 表示 一 个 微 命 令 。 每 个 微 命令 令 的 编号 同 图 7-23 所 示 的 数 
据 通路 相对 应 ,具体 功能 说 明 在 图 7-23 布 半 部 分 。 当 操作 控制 学 段 某 一 位 信息 为 “1” 时 , 表 
未 发 出 相应 的 微 命令 ; 当 某 一 位 信息 为 “0” 时 ,表示 不 发 出 该 微 命 令 。 例 如 , 当 微 指令 宇 第 
一 位 信息 为 “1” 时 ,表示 发 出 Ci 向 命令 ,那么 算术 还 辑 运算 单元 将 执行 AC< (CAC) 十 CDR) 
的 微 操 作 。 同 样 , 当 微 指令 第 二 位 信息 为 ”17 时 , 则 表示 加 ALU 发 出 进行 “一 ”的 微 命 令 ， 
ALU 就 执行 减法 操作 。 

微 命令 信号 既 不 能 来 得 太 早 ,也 不 能 来 得 太 晚 。 因 此 ,要 求 执 行 微 命令 信号 时 还 要 加 入 

时 间 控 制 , 即 与 时 友信 和 号 相 组 合 。 


计算 机 组 织 与 结构 


2) 顺序 控制 字段 

顺序 控制 字段 用 来 决定 产生 下 一 条 指令 的 地 址 。 一 条 机 融 指令 的 功能 是 用 多 条 微 指 令 
组 成 的 序列 来 实现 的 ,这 些微 指令 序列 通 篆 叫做 微 程序 。 当 执行 当前 一 条 微 指 令 时 ,必须 指 
出 下 一 条 微 指 令 的 地 址 ,以 便当 前 微 指令 执 行 完 毕 后 ,取出 下 一 条 微 指令 。 决 定 下 一 条 微 指 
令 地 址 的 方法 有 多 种 ,但 基本 上 还 是 由 微 指令 顺序 控制 字段 的 信息 来 决定 的 。 

如 图 7-24 所 示 的 微 指 令 中 ,顺序 控制 字段 中 的 第 16 一 第 19 位 将 卫 接 给 出 下 一 条 人 微 指 
令 的 地 址 ,而 第 14 .第 15 两 位 作为 判别 测试 标志 。 当 第 14\ 第 15 两 位 为 “0” 时 ,表示 不 进行 
测试 ,直接 按 顺 序 控 制 字 段 第 16 一 第 19 位 给 出 的 地 址 取出 下 一 条 微 指 令 ; 当 第 14 位 或 第 
15 位 为 “1” 时 ,表示 要 进行 Pi 或 P; 的 判别 测试 ,根据 测试 结果 对 第 16 一 第 19 位 的 某 一 位 
或 几 位 进行 修改 ,然后 按 修 改 后 的 地 址 取 下 一 条 微 指 令 。 


7.5.2， 微 程序 控制 器 的 组 成 


微 程序 控制 器 原理 框图 如 图 7-25 所 示 。 它 主要 由 控制 存储 器 (CM), 微 指令 寄存 器 
(uIR) 、 微 地 址 寄存 器 (uAR) 和 微 地 址 形成 逻辑 4 部 分 组 成 。 


微 命令 信号 
R | 控制 字段 下 地 址 字段 | 


CM 
| 


条 多 成 逻辑 | | 一 
HAR 做 地 址 ] 四 


微 程序 控制 器 组 成 原理 框图 


当 


图 7-25 
1. 控制 存储 希 


控制 存储 硕 CCM) 用 来 存放 实现 全 部 指令 系统 的 微 程序 。 控 制 存储 融 是 一 种 只 谈 型 仓 
储 船 , 微 程序 固化 在 其 中 , 微 指令 只 能 恋 出 而 不 能 改写 。 其 工作 过 程 是 : 每 谈 出 一 条 微 指 
令 , 则 执行 这 条 微 指令 ; 接 厦 又 谈 出 下 一 条 微 指令 ,又 执行 这 一 条 微 指 令 …… 谈 出 一 条 微 指 
令 并 执行 微 指令 的 时 间 总 和 称 为 一 个 微 指 令 周 期 。 在 串 行 方式 的 微 程 厅 和 令 
周期 就 是 只 旋 存 储 大 的 工作 周期 。 控 制 存 储 奉 的 字 长 就 是 微 指 令 字 的 长 度 , 其 存储 容 
决 于 机 天 指令 系统 中 指令 的 功能 及 数量 。 对 控制 存储 需 的 要 求 是 速度 要 快 , 读 出 周 其 本 
通常 来 用 高 速 半导体 存储 人 右 来 构造 。 


2. 微 指 令 寄 存 器 


微 指令 寄存 器 (IR) 用 来 存放 由 控制 存储 带 读 出 的 一 条 微 指令 信息 ,包括 操作 控制 字 
段 .判别 测试 字段 和 下 地 址 字段 的 信息 。 其 中 操作 控制 字段 提供 微 命 令 信 号 ,可 以 直接 给 
出 ,也 可 以 通过 译 公 而 提供 ,这 取决 于 微 指令 令 的 编码 方式 ; 而 判别 测试 字段 和 下 地 址 字段 决 
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定 将 要 访问 的 下 一 条 微 指令 的 地 址 。 
. 微 地 址 寄存 器 

微 地 址 寄存 一 (CnARJ) 存 放 要 访问 的 微 指 令 在 控制 存储 融 的 地 址 ,该 地 址 由 微 地 址 形成 
， 微 地 址 形成 逻辑 

在 一 般 情 况 下 ,由 控制 存储 表 谈 出 的 微 指 令 直 接 给 出 下 一 条 微 指令 的 地 址 , 通 稼 简称 为 
微 地 址 。 如 果 微 程序 不 出 现 分 文 , 下 一 条 微 指 令 的 地 址 就 直接 由 微 指 令 寄 存 生 (CIR) 的 下 
地 址 字段 决定 。 当 微 程序 出 现 分 支 时 ,意味 看 微 程序 出 现 条 件 转移 。 在 这 种 情况 下 ,通过 判 


别 测试 字段 P 和 执行 部 件 的 “状态 条 件 ” 反 僻 信 息 , 去 修改 短 地 址 寄存 带 的 内 容 , 并 按 改 好 
的 内 容 去 恋 取 下 一 条 微 指 令 。 因 此 ,和 伺 地 址 形成 逻辑 就 承担 日 动 完 成 修改 地 址 的 任务 。 


一 条 机 衙 指 令 是 由 夺 干 条 微 指 令 组 成 的 夺 列 来 实现 的 。 因 此 ,一 条 机 适 指 令 对 应 看 一 

个 微 程序 ,而 微 程序 的 总 和 便 可 实现 整个 指令 系统 。 

现在 以 表 7-3 所 示 的 模型 机 指令 系统 为 例 , 具 体 看 一 看 微 程序 控制 的 过 程 。 

表 7-3 模型 机 指令 系统 

指令 助 记 符 操作 描述 与 功能 说 阴 

LDA n AC<-n, 把 立即 数 n 传送 给 景 加 寄存 融 AC 

ADD [X] AC<(AC) 十 (X) ,AC 的 内 容 与 存储 单元 X 的 内 容 相 加 送 AC 

SUB [X] AC<(AC)-(X),AC 的 内 容 减 存储 单元 和 的 内 容 送 AC 

STR [X) X<(AC),AC 的 内 容 存 入 存储 单元 X 

JZ X 当 AC=0 时 ,PC<X; 否则 ,PC 不 变 


1. 分 析 机 器 指令 的 功能 


模型 机 指令 系统 共有 5 种 指令 ,采用 2 种 寻 址 方式 。 

LDA n, 效 据 传 送 指 令 ,及 用 立即 寻 址 方式 ,把 立即 数 n 传送 给 累加 寄存 右 AC, 给 寄存 
需 赋 初 值 。 

ADD [XX|, 加 法 指令 ,采用 直接 寻 址 方式 ,指令 执行 时 , 先 根 据 有 效 地 址 X 访问 存储 
取 操 作 数 ,然后 与 累加 寄存 器 AC 的 内 容 相 加 ,结果 送 AC。 
SUB | X |, 减法 指令 ,采用 直接 寻 址 方式 ， 指 仿 执行 时 ， 先 根据 有 交 
取 操 作 数 ,然后 用 AC Re 
STR [X], 存 操作 数 指令 ,采用 直接 寻 址 方式 ,指令 执行 时 ,AcC 的 内 容 存 人 存储 单元 入 。 

JZ X, 条 件 转移 指令 , 当 AC=0 时 ,条 件 满 足 , 用 X 修改 PC 的 内 容 , 实 现 程序 转移 ; 否 
则 ,PC 不 变 ,继续 执行 下 一 条 指令 。 


2. 设计 微 程序 流程 图 
行 ,首先 要 完成 取 指令 的 操作 。 


1 


地 址 X 访 问 存储 器 


机 梧 指 令 要 被 所 
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第 一 条 微 指令 是 “ 取 指 ” 微 指令 , 它 是 一 条 专门 用 来 取 机 各 指令 的 微 指令 ,任务 有 二 
从 内 存 取 出 一 条 机 融 指 令 ,并 把 它 存 放 到 指令 寄存 天 中 。 对 程序 计数 希 加 1, 做 好 取 Ee 
机 和 侨 指 令 的 准备 ; 对 机 器 指 § 令 的 操作 人 码 用 P; 进行 判别 测试 ,然后 修改 微 地 址 寄存 右 的 内 
容 , 给 出 下 一 dd 转 加 相应 指令 的 微 程序 段 。 

模型 机 指令 系统 的 微 程序 流程 图 如 图 7-26 所 示 。 可 以 看 到 ,每 一 条 微 指令 用 一 个 长 方 
框 表示 。 每 一 做 指 令 的 地 址 用 数字 标 于 长 方 框 的 右上 和 角 。 注 意 , 委 形 框 代表 判别 测试 , 它 的 
动作 依附 于 上 一 条 微 指令 。 当 微 程序 转 回 公 操 作 ( 用 符号 ”一 一 ”表示 ) 时 ,如 条 没有 外 围 设 
备 请 求 服务 ,那么 将 转 回 取 下 一 条 机 策 指 令 。 


取 指 0000 


AR—PC, PC+] 


RDNM, IR— DR 


0000 
LDAn ADD [X] SUB [X] STR [X] JZX 
0010 0100 y 0110 1000 


AR<—IR(ADR) 
DR 一 AC 

| M(AR)—DR, WRM 
0000 0101 | 0111 | ,0000 


DR--IR(ADR)， ARIR(ADR). AR IR(ADR)， 


AC—ALU—DR RDMI RDMI 


PC--IR(ADR) 


AC (AC}H(DR) AC- 一 (ACT-(DR) 


0000 0000 


图 7-26 模型 机 指令 系统 的 微 程 序 流程 图 
3. 编写 微 程序 


假定 模型 机 的 CPU 如 图 7-23 所 示 ,采用 如 图 7-24 所 示 的 筑 
统 的 微 程 序 法 程 图 如 图 {-20 所 示 ,这样 . 就 可 编写 出 | 如 二 
程序 代码 。 


指令 格式 ,模型 机 指令 系 
7-4 所 示 的 模型 机 指令 系统 的 微 


表 7-4 模型 机 指令 系统 的 微 程序 代码 


控 存 地 址 控制 字段 CIC2C3 CC 测试 字段 卫 后 继 微 地 址 字段 
0000 0001 0000 0011 1 ] 0 0000 
0010 0010 0001 0000 0 0 0 O0000 
0100 0001 0000 1000 0 U 0 0101 
0101 1000 0000 0000 0 U O000 
0110 0001 0000 1000 0 U 0 0111 
0111 0100 0000 0000 0 U UUUU 
1000 0000 1100 1000 0 0 O0000 
1010 0000 0000 0000 0 01 O0000 


1011 0000 0000 0100 0 U 0000 
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假设 把 已 经 编 好 的 微 程序 存放 到 控制 存储 豆 中 , 当 机 顺 局 动 时 ,只 要 给 出 控制 存储 需 的 
首 地 址 ,就 可 以 调 出 所 需要 的 微 程序 。 

为 此 ,首先 给 出 第 一 条 微 指令 的 地 址 0000 ,经 地 址 译 码 ,控制 存储 器 选中 所 对 应 的 “ 取 
指 ” 微 指令 ,并 将 其 读 到 微 指令 寄 存 右 (1IR) 中 ,第 一 条 微 指令 的 二 进 制 编码 如 表 7-4 所 示 。 
它 的 操作 控制 字段 要 发 出 4 个 微 命 令 ; 发 出 Ci; 微 命令 ,将 PC 内 容 送 到 地 址 寄存 需 (AR) ; 
发 出 Ci 微 命 令 ,PC 日 加 1; 发 出 CG, 微 命令 ,内存 执行 谈 操 作 , 从 内 存单 元 取出 机 表 指 令 代 
码 送 到 缓冲 寄存 器 DR; 发 出 Ci; 微 命令 ,将 DR 中 的 机 器 指令 代码 再 送 到 指令 寄存 器 (CIR) 。 
Ci 发 出 了 PC 十 1 微 命 令 ,使 程序 计数 器 加 1, 做 好 取 下 一 条 机 需 指 令 的 准备 。 另 一 方面 , 微 
站 令 的 顺序 控制 字段 指明 下 一 条 微 指令 的 地 址 是 0000 ,但 是 由 于 判别 字段 中 第 14 位 为 1， 
表明 是 Pi 测试 ,因此 0000 不 是 下 一 条 微 指 令 具 正 的 地 址 。Pi 测试 的 “状态 条 件 ” 是 指令 寄 
存 右 的 操作 码 字 段 , 即 用 OP 字段 作为 形成 下 一 条 微 指 令 的 地 址 ,于 是 微 地 址 寄存 占 的 内 容 

如 有 条 在 第 一 个 CPU 周期 完成 后 ,取得 的 指令 是 JZ X, 经 Pi 测试 形成 的 下 一 条 微 指 令 
的 地 址 是 1010 ,按照 1010 这 个 微 地 址 读 出 第 二 条 微 指 令 , 它 的 二 进 制 编码 如 表 7-4 所 示 。 
在 这 条 微 指令 中 ， 顺序 控制 部 分 由 于 判别 字段 中 P, 为 1, 表 明 进 行 P; 测试 ,测试 的 “状态 条 
件 ” 为 进位 标志 AC 二 0。 换 句 话 说 ,此 时 微 地 址 0000 需要 进行 修改 , 当 AC=0 时 ,下 一 条 微 
首 令 的 地 址 为 1011; 当 AC 关 0 时 ,下 一 条 人 微 指令 的 地 址 为 0000。 显 然 ,在 测试 一 个 状态 
时 ,有 两 条 微 指 令 作 为 要 执行 的 下 一 条 微 指 令 的 “候选 ” 微 指令 。 现 在 假设 AC 二 0, 则 要 执 
行 的 下 一 条 微 指 令 地 址 为 1011。 按 照 1011 这 个 微 地 址 读 出 的 微 指 令 , 其 控制 字段 发 出 Cio 
微 命令 ,完成 修改 PC 的 操作 ,从 而 实现 了 条 件 转移 。 

和 就 可 以 看 到 微 程序 控制 的 主要 思想 及 工作 原理 。 

< 上述 步骤 把 指令 系统 中 的 所 有 指令 的 微 程 序 段 部 编写 好 ,然后 固化 在 控 存 中 ,这 样 就 
eer 要 注意 的 是 ,对 于 不 同 指令 的 微 程 序 段 的 公 操 作用 一 样 的 微 
指令 ,这 样 可 节省 控 存 的 容量 。 

下 面 介 绍 微 程序 控制 的 计算 机 的 工作 过 程 。 计 算 机 加 电 以 后 ,首先 由 复位 信号 (Reset) 
将 开机 后 执行 的 第 一 条 指令 的 地 址 送 入 PC 内 ,同时 将 一 条 “ 取 指 ” 微 指令 送 入 微 指令 寄存 
右 中 ,并 将 其 他 一 些 有 关 的 状态 位 或 寄存 器 置 于 初始 状态 。 当 电压 达到 稳定 值 后 ,自动 启动 
计算 机 ,产生 节拍 电位 和 工作 脉冲 。 为 保证 计算 机 正 篆 工作 ,电路 必须 保证 开机 后 第 一 
右 周 期 信号 的 完整 性 ,在 该 CPU 周期 末 , 产 生 开 机 后 的 第 一 个 工作 脉冲 。 然 后 计算 机 开始 
执行 程序 ,不断 地 取出 指令 .执行 指令 。 

程序 可 以 存放 在 固定 存储 剖 中 ,也 可 以 利用 固化 在 只 读 存 储 各 (ROMD) 中 的 一 小 段 引 于 
程序 ,将 要 执行 的 程序 和 数据 从 外 部 设备 调和 人 主 存 。 实 现 各 条 指令 的 微 程序 是 存放 在 微 程 
序 控制 带 中 的 。 当 前 正在 执行 的 微 指 令 从 微 程 序 控制 名 中 取出 后 放 在 微 指 令 寄 人 存 套 中 ,由 
微 指 令 的 控制 字段 中 的 各 位 直接 控制 信息 和 数据 的 传送 ,并 进行 相应 的 处 理 。 当 和 遇 到 停机 
下 令 或 外 来 停机 命令 后 ,应 该 等 当前 这 条 指令 执行 完 后 再 停机 或 至 少 在 本 机 各 周 期 结束 时 
停机 。 要 保证 停机 后 ,重新 局 动 计 算 机 能 继续 工作 而 且 不 出 现任 何 错误 。 

前 面 介 绍 了 微 程 序 控 制 计 算 机 工作 的 过 程 。 实 现 这 一 过 程 的 方法 有 很 多 ,硬件 结构 也 
有 很 大 的 差别 ,这 里 只 是 向 单 说 明 一 种 实现 的 方法 。 
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做 程 友 控制 的 特 吕 CE 

1. 微 指 令 周 期 与 CPU 周期 的 关系 

在 串 行 方式 的 微 程序 控制 禹 中 , 微 指 令 周 期 等 于 读 出 微 指令 的 时 间 加 上 执行 该 条 微 指 
令 的 时 间 。 为 了 保证 整个 机 融 控 制 信号 的 同步 ,可 以 将 一 个 微 指 令 周 期 时 间 设 计 得 恰好 和 
CPU 周期 时 间 相 等 。 图 7-27 给 出 了 微 指令 周期 与 CPU 周期 的 时 间 关 系 。 
执行 微 指令 徽 指令 周期 -六 做 指 仿 


CPU 周期 CPU 周期 


/.5.4 


图 7-27” 微 指令 周期 与 CPU 周期 的 时 间 关 系 


i CPU 周期 包含 4 个 每 间 阳 的 廊 拍 脉冲 1 a , 右 每 个 脉 证 宽度 为 200ns 。 用 1 
作为 读 取 微 指 令 的 时 间 , 用 荆 十 TT tT I MAN 指令 I 
毕 , 可 用 TT， 上升 沿 将 运算 结 结果 打 信 某 个 寄存 器 ， 同时 可 用 TT 间隔 读 取 下 条 微 指令 ,经 
200ns 的 时 间 和 延迟 ,下 条 微 指令 又 从 控制 丰 计生 读 出 ,并 在 T， 上 升 沿 打 入 微 指 全 省 存 器 
如 忽略 触发 右 的 翻转 延 运 ,那么 下 条 微 指 令 的 微 命 令 信 号 就 从 T! 上 升 沿 开 始 有 效 , 和 耳 到 下 
一 条 微 指令 读 出 后 打 和 信 微 指 令 寄 存 冀 为 止 。 因 此 一 条 微 指 令 的 保持 时 间 恰 好 是 800ns, 也 
就 是 一 个 CPU 周期 的 时 间 。 


通过 前 面 的 学 习 , 能 全 面 了 解 微 指令 与 机 器 指令 的 关系 。 现 在 把 微 指令 与 机 器 指令 之 
间 的 关系 归纳 如 下 : 

(1) 一 条 机 器 指令 对 应 一 段 微 程序 ,而 微 程序 是 由 大 干 个 微 指令 序列 组 成 的 ,因此 ,一 
条 机 响 指 令 的 功能 是 由 才干 条 指令 0 即 一 条 机 器 指令 所 完成 的 操作 可 
通过 知 干 条 微 指令 来 完成 ,由 微 指令 进行 解释 和 执行 

(2) 从 指令 与 微 指 令 .程序 hi 序 、 主 存 与 和 tl 全 今 
控 存 ,地 址 与 微 地 址 的 一 一 对 应 关系 可 知 , 指 令 、 | 程序 计数 器 PC | 
程序 和 地 址 与 主 存储 右 有 关 ; 而 微 指 令 、 微 程序 和 微 指 令 寄存 器 
微 地 址 与 控制 存储 器 有 关 , 并 且 也 有 相对 应 的 硬 


设备 。 做 指令 与 机 靛 指令 间 的 关系 如 图 7-28 


所 示 。 
缓冲 寄存 器 DR 


控制 仔 悄 珍 
CM 


(3) 由 于 一 个 CPU 周期 对 应 一 条 微 指令 ,在 
7. 2 下 和 曾 讲 述 指 令 周 期 与 机 甫 周期 的 概念 ,并 归纳 
了 4 条 典型 指令 的 指令 周期 。 从 指令 的 微 程序 流 
程 图 中 看 到 设计 第 程序 的 流程 ,也 可 进一步 明确 
机 器 指令 与 微 指 令 的 关系 。 图 7-28 微 指 令 与 机 器 指令 之 间 的 关系 图 


做 地 址 寄 仔 芋 
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3. 做 程序 探 制 冀 与 硬 布 线 探 制 冀 的 比较 


便 布 线 控制 闫 与 微 程序 控制 血 相 比较 ,在 操作 控制 信和 号 的 形成 上 有 较 大 的 区 别 外 ,其 他 
没有 本 质 的 区 别 。 对 于 实现 相同 的 一 条 指令 ,不管 是 采用 便 布 线 控制 还 是 来 用 微 程序 控制 
技术 ,都 可 以 采用 多 种 设计 方案 ,导致 了 各 种 不 同 的 控制 套 在 具体 实现 方法 和 手段 上 的 区 
别 ,性 能 也 会 有 所 差异 。 

微 程 夺 控 制 冀 与 便 布 线 控制 冀 的 主要 区 别 可 归纳 ; 

1) 实现 方式 

微 程 序 控制 融 的 控制 功能 是 在 存放 微 程序 的 控制 存储 融和 存放 当前 正在 执行 的 微 指 人 
的 寄存 徊 的 且 接 控制 下 实现 的 ,而 便 布 线 控制 右 的 控制 功能 则 由 逻辑 门 组 合 实现 。 微 程序 
控制 硕 的 电路 比较 规整 ,各 条 指令 信号 的 差别 集中 在 控制 存储 融 内 容 上 ,因此 ,无 论 是 增加 
或 修改 指令 都 只 要 增加 或 修改 控制 存储 兰 内 容 即 可 。 寿 控制 存储 带 是 ROM, 则 要 更 换 心 
片 ,在 设计 阶段 可 以 先 用 RAM 或 EPROM 来 实现 ,验证 正确 后 或 成 批 生产 时 ,再 用 ROM 
代 蔡 。 硬 布线 控制 磊 的 控制 信号 先 用 逻辑 表达 式 列 出 ,经 化 和 测 后 用 电路 来 实现 ,因此 ,显得 
云 乱 复杂 , 当 需 要 修改 指令 或 增加 指令 时 就 必须 重新 设计 电路 ,非常 且 烦 而 且 有 时 甚至 无 法 
改变 。 因 此 , 微 程 序 控制 取代 了 硬 布线 控制 并 得 到 了 广泛 应 用 ,尤其 是 指令 复杂 的 计算 机 ， 
一 般 部 米 用 微 程序 来 实现 控制 功能 。 

2) 性 能 方面 

在 同样 的 半导体 工艺 条 件 下 , 微 程序 控制 的 速度 比 便 布 线 控制 的 速度 慢 , 因 为 执行 每 条 
微 指 信 屠 要 从 控制 行 了 各 中 读 取 ， 影响 了 速度 ; 而 硬 布线 控制 逻辑 主要 取决 于 电路 延 时 , 因 
而 在 超 高 速 机 器 中 ,对 影 速度 的 关键 部 分 和 (核心 部 件 CPU) 往 往 采用 硬 布线 逻辑 实现 . 
近年 来 ,在 一 些 新 型 的 计算 机 系统 中 ,例如 ,RISC( 精 简 指 令 系统 计算 机 ) 中 ,一 般 均 选用 硬 
布线 逻辑 电路 。 


J 以 下 两 点 。 


7.6 微 程序 设计 技术 


根据 7.5 节 的 内 容 我 们 知道 , 微 程 序 就 是 微 指 令 的 集合 。 在 实际 设计 中 所 追求 的 应 是 
* 量 减 小 探 存 的 容量 ,提高 微 程序 的 执行 效率 ,设计 灵活 ,便于 修改 。 而 探 存 容量 的 大 小 、 微 
人 -效率 很 大 程度 上 取决 于 微 指令 的 结构 ,因此 , 微 程 序 设计 的 关键 是 如 何 确定 微 指 

结构 ,设计 微 指 令 结构 应 当 退 求 的 目标 是 : 

eu 令 宁 长 度 ; 

(2) 有 利于 减 小 控制 存储 天 的 容量 ; 

(3) 有 利于 减少 微 程序 的 长 度 ; 

(4) 有 利于 提高 微 程序 的 执行 速度 

(5) 有 利于 对 微 指令 进行 修改 ; 

(6) 有 利于 提高 微 程序 设计 的 灵活 性 。 

这 些 也 是 微 程序 设计 技术 所 要 讨论 的 问题 。 
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7.6.1 微 命令 编码 


前 面 已 讲 到 , 微 指令 是 由 操作 控制 字段 和 顺 友 控制 学 段 所 组 成 的 。 微 命令 编 公 ， 
指令 中 的 操作 控制 学 段 进 行 编 码 表示 , 通 第 有 以 下 几 种 编码 方法 。 


及 用 直接 表示 法 的 微 指令 结构 如 图 7-29 所 示 , 其 特点 是 操作 控制 字段 中 的 每 一 位 代表 
一 个 微 命 令 ,在 设计 微 指 令 时 ,只 要 将 微 指令 操作 控制 字段 相应 的 位 置 成 "17 或 “0”, 便 可 发 
出 或 禁止 某 个 微 命 令 , 这 就 是 耳 接 表示 法 。 


微 命令 微 命令 


操作 控制 字段 帆 序 控制 拖 让 


图 7-29 ” 微 指令 结构 一 一 直接 表示 法 


:的 优点 是 简单 .直观 ,输出 直接 用 于 控制 , 微 命令 的 并 行 控制 能 力 强 , 编 写 的 微 


这 种 方 ; 
程序 行 数 少 。 缺 点 是 微 指令 字 较 长 ,如 有 果 一 台 计 算 机 的 微 命令 有 400 个 , 则 微 指令 的 控制 学 
人 400 位 ,这 会 使 微 指 令 字 的 长 度 达 到 难以 接受 的 地 步 ,而且 ,对 如 此 长 的 微 指令 字 ,在 

定 的 任何 一 条 微 指令 中 ,第 第 仅 有 少数 几 个 微 命 令 , 因 此 只 有 少数 几 位 置 1, 造 成 位 空间 
om 也 造成 了 控 存 空间 的 良 费 。 因 此 ,为 了 缩短 微 指 令 字 的 长 度 , 可 以 采用 字段 
直接 详 码 法 


和 辣 


2. 字段 直接 译 码 法 


事实 上 ,在 控制 数据 通路 的 操作 中 ,大 多 数 微 命令 不 是 同时 需要 ,而且 许多 微 命 令 是 互 
相 排斥 。 例 如 ,控制 ALU 操作 的 各 种 微 命令 (如 十 、 一 、Move 等 ) 不 能 同时 出 现 , 即 在 一 条 
微 指 令 中 只 能 出 现 一 种 运算 操作 ; 又 如 存储 各 的 读 / 写 操作 也 不 能 同时 出 现 。 通 常 将 在 同 
一 个 微 指 令 周 期 中 不 能 同时 出 现 的 微 命令 称 为 相 帮 性 微 命 令 , 将 在 同一 个 微 指 令 周 期 中 可 
以 同时 出 现 的 微 命令 称 为 相 容 性 微 命 令 。 

字段 二 接 详 人 码 法 ,是 把 一 组 相 夺 性 的 微 命令 旨 po 一 个 字段 ,用 字段 的 不 同 代 码 表示 不 同 
的 微 命令 ,然后 通过 字段 译 码 胡 对 每 一 个 微 命令 进行 译 码 , 译 人 码 输出 作为 微 操作 控制 信和 号， 
其 微 指 令 结 构 如 图 7-30 所 示 ，。 

字段 直接 幸 码 法 可 以 缩短 微 指令 字 的 长 度 。 例 如 , 某 机 送 指 令 系 统 总 共 需 要 300 个 微 
命令 令 的 操作 控制 字段 需 300 位 。 采 用 罕有 段 耳 接 详 人 码 法 ,如 用 4 位 


命令 ,来 用 和 下 接 表 示 法 , 微 指 令 
二 进 制 代码 表示 一 个 字段 ,经 字段 译 码 右 输 出 ,可 产生 15 个 相 斥 的 微 命令 ,总 共 20 个 字段 
就 可 以 获得 300 个 微 命令 。 注 意 ; 通 第 全 “0” 编码 表示 不 发 出 任何 微 命 令 。 微 指令 的 操作 
控制 字段 仅 80 位 。 在 此 虽然 增加 了 一 些 译 码 线路 ,但 使 控制 存储 器 的 容 量 大 大 缩小 ,这 是 
一 种 较为 经 济 的 做 法 。 

字段 直接 译 码 法 的 分 段 原 则 如 下 : 


CT Ta 
操作 控制 字段 顺序 控制 字段 
芍 指 令 结构 一 一 字段 直接 译 码 法 


(1) 相 斥 性 微 命 令 分 在 同一 字段 内 , 相 容 性 微 命 令 分 在 不 同 字 段 内 。 前 者 可 缩短 微 指 
令 的 字 长 ,后 者 有 利于 实现 并 行 操作 ,加 快 指令 的 执行 速度 。 

(2) 一 般 将 同 交 操作 (或 控制 同一 部 件 的 操作 ) 中 互 斥 的 微 命 令 划 分 在 一 个 字段 内 ,如 
控制 ALU 操作 的 微 命令 十 ,一 、Move 等 划分 在 一 个 字段 内 。 这 样 做 使 得 微 指令 的 结构 清 
晰 ,易于 编写 微 程 序 , 也 易于 修改 扩充 功能 。 

(3) 每 个 字段 包含 的 信息 位 不 能 太 多 ， Ag 

字段 诺 码 方法 既 能 缩短 微 指令 字 长 度 , 又 有 并 行 操 作 效 率 高 的 优点 ,执行 速度 也 比较 
快 ,因此 ,得 到 了 广泛 的 应 用 ,如 IBM 370 系列 .VAX-11 系列 机 都 采用 此 编码 法 。 


3. 混合 表示 法 


混合 表示 法 是 把 直接 表示 法 与 字段 直接 幸 但 法 混合 使 用 , 即 部 分 微 命 令 用 分 段 编码 表 
示 , 将 一 些 速 度 要 求 高 ,或 与 其 他 微 命令 都 相 容 的 用 卫 接 方式 表示 ,其 微 指 令 结 构 如 图 7-31 
所 示 。 混 合 表 示 法 能 综合 考虑 微 指 令 字 长 .灵活 性 和 执行 微 程 序 速 度 等 方面 的 要 求 。 


短 草 令 做 后 令 做 命令 
Cw 
本 二 T 和 T 


操作 控制 字段 顺序 控制 字段 
图 7-31 微 指令 结构 一 一 混合 表示 法 


4. 单数 字段 控制 法 


万 外 ,在 微 指令 中 还 可 以 附设 一 个 第 数字 段 ,就 像 指 令 中 的 立即 数 一 样 ,来 给 共 些 执行 
部 件 直 接 发 送 第 数 。 该 第 数字 段 可 作为 操作 数 送 入 ALU 参与 运算 ,也 可 作为 计数 天 初 但 
用 来 控制 微 程序 循环 次 数 。 

【 例 7.2】 表 7-5 中 给 出 了 8 条 微 指令 了 工 一 E 所 包含 的 微 命 令 控制 信号 。 试 设计 微 指 
令 操 作 控 制 字 有 段 的 格式 ,要 求 所用 的 控制 位 最 少 ,而 且 保 持 微 指令 本 号 内 在 的 并 行 性 。 

解 : 

要 使 操作 控制 位 最 少 , 则 应 利用 字段 译 码 法 对 相 斥 性 微 命令 进行 编码 ; 要 保持 并 行 性 ， 
则 尽量 对 相 容 性 微 命令 进行 直接 编码 。 在 同一 条 人 短 指令 中 出 现 的 微 命令 即 可 认为 它们 可 并 
行 , 因 此 可 采用 混合 表示 法 进行 编码 。 
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表 7-5 8 条 微 指令 工 一 了 


微 指 令 所 含 微 命 令 微 指 令 所 含 微 命令 
1 ABLDE 1 CEGI 
] ADF(G ls AHI] 
1, BH 1 CDH 
L (_ 1s ABH 
观察 表 7-5 可 以 发 现 工 一 [8 条 微 指 令 中 共有 A、B、C、D、E、F、G、H、I、J 共 10 个 微 命 


令 ,注意 观察 表 中 各 命令 间 的 关系 ,尤其 是 两 两 互 太 的 。 站 先 由 工 微 指令 可 知 ,A、B、C、D、 下 
是 相 容 微 命 令 ,任意 两 个 都 不 能 分 在 同一 个 人 字段。 又 通过 比较 ,可 知 以 下 两 组 短命 令 两 两 互 
厅 : {4B、I、J}、{E、F、H}), 所 以 ,可 按 如 图 7-32 所 示 的 方式 进行 编码 ,只 需 8 位 ,当然 ,结果 不 
是 唯一 的 ,还 可 有 其 他 的 编码 方式 。 


直接 控制 译 码 译 码 
A 人 D G 01—E 0U1 一 尼 
10 一 上 ]U- 一 | 
] 1 一 H | 1 -一 
ww | wx | 
操作 控制 字段 顺序 控制 字段 


7-32 ~Ts 8 条 微 指 令 的 结构 
7.6.2 微 地 址 的 形成 方法 


微 程序 的 执行 过 程 如 同 程序 的 执行 过 程 一 样 ,也 存在 执行 顺序 的 控制 问题 ,所谓 微 程序 
的 顺序 控制 是 指 在 执行 现行 微 指令 的 过 程 中 或 在 执行 完毕 后 ,怎样 控制 产生 下 一 条 微 指令 
的 地 址 。 下 面 讨论 微 指令 中 地 址 字段 和 后 继 微 地 址 的 形成 问题 ， 


1. 微 程序 入 口 地 址 的 形成 


由 于 每 条 机 融 指 令 都 需要 取 指 操作 ,所 以 将 取 指 操作 编制 成 一 段 公 用 微 程序 , 通 稍 安排 
在 控 存 的 0 号 或 特定 单元 开始 的 一 段 控 存 空 间 内 。 

每 一 条 机 器 指令 对 应 着 一 段 微 程序 "其 人 入口 就 是 初 如 征地 址 。 首先 由 “ 取 指 令 ” 微 程序 
取出 一 条 机 各 指令 到 IR 中 ,然后 根据 机 划 指 令 操 作 人 码 转 换 成 该 指令 对 应 的 微 程 序 人 口 地 
址 。 这 是 一 种 多 分 文 ( 或 多 路 转移 ) 的 情况 , 稍 用 以 下 三 种 方式 形成 微 程序 的 人 口 地 址 。 

1) 一 级 功能 转移 

如 果 机 天 指令 操作 码 字 段 的 位 数 和 位 置 固定 ,可 以 直接 使 操作 码 与 人 口 地 址 码 的 部 分 
位 相对 应 。 例 如 , 某 计 算 机 有 16 条 机 策 指 令 ,指令 操作 人 码 用 4 位 二 进 制 数 表示 ,分 别 为 
0000 .0001、…、1111。 现 以 字母 Q 表示 操作 码 , 令 微 程序 的 入 口 地 址 为 Q11B, 例 如 
000011B 为 MOV 指令 的 入 口 地 址 ,000111B 为 ADD 指令 的 入 口 地 址 ,001011B 为 SUB 指 
仿 的 人 口 地址 ee 

由 此 可 见 , 相 邻 两 段 微 程序 的 入口 地 址 相差 4 个 单元 ,如 图 7-33 所 示 。 

2) 二 级 功能 转移 

多 和 位 置 不 固定 , 需 米 用 分 级 转移 , 弟 一 次 先 按 指 


和 耕 各 类 指令 的 操作 人 码 的 位 令 类 型 标志 
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转移 ,以 区 分 出 指令 属于 哪 一 类 ,如 单 操 作 数 指令 、 双 操作 数 指令 等 。 在 每 一 人 令 中 
的 操作 码 的 位 数 和 位 置 应 当 是 固定 的 ， 第 二 次 即 可 按 操 作 码 区 分 出 具体 是 哪 条 指令 ,以便 转 
移 到 相应 微 程序 人 口 。 


公用 微 程序 段 


程序 人 口 地 址 


3) 通过 PLA 电路 实现 功能 转移 

可 编程 逻辑 阵列 (PLA) 实 质 上 是 一 种 详 码 -编码 阵列 ,具有 多 个 输入 和 多 个 输出 ,PLA 
的 输入 是 机 顺 操 作 码 和 其 他 判别 条 件 ,PLA 的 输出 就 是 相应 微 程序 的 人 口 地 址 ,这 种 方法 
对 于 变 长 度 、 变 位 置 的 操作 码 的 处 理 更 为 有 效 而 且 转 移 速度 较 快 。 


2. 后 继 微 地 址 的 形成 


在 转移 到 一 条 机 器 指令 对 应 的 征程 序 人 口 地 址 后 , 则 开始 执行 微 程 序 ,每 条 微 指 令 执行 
完毕 时 , 需 根 据 其 中 的 顺序 控制 字段 的 要 求 形 成 后 继 币 指 令 地 址 。 

1) 增 量 方式 (顺序 -转移 型 微 地 址 ) 

这 种 方式 和 机 莫 指令 的 控制 方式 相 类 似 , 它 也 有 顺序 执行 转移 和 转子 之 分 。 顺 友 执 行 
时 ,后 继 微 地 址 就 是 现行 微 地 址 加 上 一 个 增 量 ( 通 常 为 “1”); 转移 或 转子 时 ,由 微 指令 的 顺 
序 控制 字段 产生 转移 微 地 址 。 因 此 , 微 程序 控制 闫 中 应 当 有 一 个 微 程 序 计 数 郑 (CnPC)。 为 
降低 成 本 ,一般 情 况 下 都 是 将 微 地 址 寄存 冀 LAR 改 为 具有 计数 功能 的 寄存 着 以 代 和 蔡 uPC。 

在 非 顺序 执行 微 指 令 时 ,用 转移 微 指令 实现 转移 。 转 移 微 指令 的 顺序 控制 字段 分 成 两 
部 分 : 转移 控制 字段 (BCF) 与 转移 地 址 字段 (BAF), 如 图 7-34 所 示 。 由 这 两 个 字段 结合 , 当 
转移 条 件 满 足 时 ,将 转移 地 址 字段 作为 下 一 个 微 地 址 送 uPC; 当 转 移 条 件 不 满足 时 ,将 耳 接 


从 人 微 程 序 计数 大 uPC 中 取得 下 一 条 微 指 令 地 址 。 
技 移 控制 字段 | 转移 地 址 字段 


BCFEF BAF 


操作 控制 字段 顺序 控制 字段 
图 7-34” 微 指令 结构 一 一 增 量 方式 产生 后 继 微 地 址 


实现 增 量 方式 的 人 微 程序 控制 右 如 图 7-35 所 示 。 其 中 , 微 程序 计 数 副 (pyPC) 的 位 数 与 控 
制 存 储 器 (CM) 的 容量 相 适 应 ,由 uPC 给 出 CM 地 址 ,然后 从 CM 中 顺序 读 出 微 指 令 
起 始 和 转移 地 址 发 生 需 的 功能 有 两 个 : 一 个 功能 是 当 一 条 新 的 机 和 大 指 令 疾 入 IR 时 , 它 


就 形成 机 器 指令 的 微 程序 段 的 起 始 地 址 且 装 入 pyPC, 而 且 随 着 节拍 电位 信和 号 的 到 来 ,uPC 
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自动 地 增加 一 个 增 量 ,以 便 连 续 地 从 CM 中 读 出 微 指令 ,相应 的 微 操作 控制 信号 按 规定 顺 
序 发 送 到 CPU 的 各 个 部 分 ; 另 一 个 功能 是 当 微 指令 指示 其 测试 状态 标志 、 条 件 代码 或 机 器 
指令 的 某 些 位 时 , 它 就 对 指定 的 条 件 进 行 测试 , 若 满足 转移 条 件 ,就 把 新 的 转移 地 址 装 人 
pwPC, 实 现 转移 ; 否则 不 装 和 新 地 址 , 微 程序 就 顺序 执行 。 所 以 ,每 次 从 CM 中 取出 一 条 于 
的 微 指令 时 ,uPC 都 增加 ,只 有 下 列 情况 例外 : 


操作 控制 字段 “| 转移 控制 


顺序 控制 字段 


CM 太 
条 


人 


微 程 序 计数 器 (PC) 


实现 增 量 方式 的 微 程序 控制 器 


OO 遇 到 END 微 指令 时 ,就 把 “ 取 指 ” 微 程序 的 人 人 口 地 址 流入 PC, 开 始 取 指 令 周 期 。 

当 一 条 新 的 指令 滩 入 IR 时 ,就 把 该 指令 的 微 程 序 的 人 口 地 址 滩 入 pjPC。 

遇 到 转移 微 指令 有 旦 满足 转移 条 件 时 ,就 把 转移 地 址 疙 入 uPC。 

首 量 方式 的 优点 是 和合 单 ,易于 和 擎 握 , 编 制 微 程序 容 多 ,每 条 机 冀 指 令 所 对 应 的 一 段 微 程 

序 一 般 安 排 在 CM 的 连续 单元 中 ; 其 缺点 是 这 种 方式 不 能 实现 两 路 以 上 的 并 行 微 程序 转 
移 ,因而 不 利于 提高 微 程 序 的 执行 速度 。 

2) 朵 和 定 方 式 

汤 定 方式 与 增 量 方式 不 同 , 它 不 米 用 wxPC, 微 指令 地 址 由 微 地 址 寄存 条 (AR) 提 供 。 
在 微 指 令 格 式 中 ,设置 一 个 下 地 址 字段 ,用 于 指明 下 一 条 要 执行 的 微 指 令 地 址 。 当 一 条 微 指 
令 被 取出 时 ,下 一 条 微 指 令 的 地 址 ( 即 下 地 址 字段 ) 送 kwAR。 它 相当 于 每 条 微 指令 都 具有 和 转 
移 微 指令 的 功能 。 采 用 这 种 方法 就 不 必 设 置 专门 的 转移 微 指 令 ,但 增加 了 微 指令 字 的 长 度 。 

3) 增 量 方式 与 断定 方式 的 结合 

这 种 控制 方式 中 , 微 地 址 寄存 器 (AR) 有 计数 的 功能 (断定 方式 中 的 微 地 址 寄存 器 
(AR) 无 计数 功能 ) ,但 在 微 指 令 中 仍 设 置 一 个 顺序 控制 字段 ,这 是 一 种 增 量 方式 与 断定 方 
式 相 结合 的 方式 。 其 顺序 控制 字段 一 般 由 两 部 分 组 成 : 顺序 地 址 字段 和 测试 字段 。 

OD 顺序 地 址 字段 。 可 由 设计 者 指定 ,一 般 是 微 地 址 的 高 位 部 分 ,用 来 指定 后 继 微 地 址 
在 CM 中 的 某 个 区 域内 。 

测试 字段 。 根 据 有 关 状 态 的 测试 结 采 确定 其 地 址 值 ,一 般 对 应 于 微 地 址 的 低位 部 
分 ,相当 于 在 指定 区 域内 确定 具体 的 分 文 。 所 依据 的 测试 状态 可 能 是 指定 的 开关 状态 .指令 

测试 字段 如 果 只 有 一 位 , 则 微 地 址 产生 两 路 分 文 ; 奋 有 两 位 , 则 最 多 可 产生 四 路 分 文 ; 
以 此 类 推 ,测试 字段 为 n 位 为 最 多 可 产生 2" 路 分 支 。 

吞 无 转移 要 求 , 则 微 地 址 寄存 器 计数 得 到 后 继 微 指令 的 地 址 。 
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改 其 内 容 时 ,可 通过 某 一 位 触 


【 例 7.3】 微 地 址 寄存 器 有 6 位 (uA; 一 uAo), 当 需要 修 
发 需 的 置 1 端 S$ 将 其 置 *1”。 现 有 以 下 三 种 情况 : 

(1) 执行 “ 取 指 ? 微 指 令 后 , 微 程序 按 IR 的 OP 字段 (CIR: 一 IR,) 进 行 16 路 分 支 ; 

(2) 执行 条 件 转移 指令 微 程序 时 , 按 进 位 标志 CC 的 状态 进行 2 路 分 文 ; 

(3) 执行 控制 台 指令 微 程序 时 , 按 IR， JIRs 的 状态 进行 4 路 分 支 。 

请 按 多 路 转移 方法 设计 微 地 址 转移 逻辑 。 

解 : 按 所 给 设计 条 件 , 微 指令 的 顺序 控制 字段 有 三 种 判别 测试 ,分 别 为 Pi 、P; 、P;。 由 于 
修改 pwA; 一 ppAu 内 容 具 有 很 大 的 灵活 性 , 现 分 配 如 下 : 

(1) 用 P, 和 了 :一 IR。 修改 As 一 Abo; 

(2) 用 P, 和 C 修改 .Ao; 

(3) 用 P; IR; ,IRs 修改 wA; 、A，。 

另外 还 要 考虑 时 间 因 素 T, (假设 CPU 周期 
如 下 : 


uA;=P:;* IR; 。 工 
uAs=P,* IR,* 1, 
As 一 PP * IR;* T, 
MA 一 PP * IR,»* T, 
uAl=P,.* IR,* T, 
uAo=P.* IR,* TTP,*C* TT, 
由 于 从 触发 大 置 1 痪 SS 修改 , 故 前 5 个 表达 式 人 
门 实现 。 如 图 7-36 所 示 即 为 征地 址 转移 逻辑 图 。 


图 7-36 微 地 址 转移 逻辑 图 


7.6.3 微 指令 的 格式 及 执行 方式 


1. 微 指令 的 格式 


微 指令 操作 控制 字段 的 表示 方法 是 决定 微 指令 格式 的 主要 因素 。 在 设计 计算 机 时 , 考 
虑 到 速度 .成 本 等 原因 ,可 采用 不 同 的 编码 译 码 控制 法 , 即 在 一 台 计算 机 中 ,也 有 几 种 编码 译 
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码 控制 法 同时 存在 的 情况 。 微 指令 的 格式 大 体 分 成 两 类 : 水 平 型 微 指令 和 垂直 型 微 指 令 。 
1) 水 平 型 微 指令 
一 次 能 定义 并 执行 多 个 并 行 操 作 微 命令 的 微 指 令 , 叫 做 水 平 型 微 指令 。 水 平 型 微 指令 
的 一 般 格 式 如 图 7-37 所 示 。 


判别 测试 字段 | 后 继 地 址 字段 


按照 控制 字段 的 编码 方法 不 同 , 水 平 型 微 指令 又 分 为 三 种 : 第 一 种 是 全 水 平 型 ( 直 接 表 
示 法 ) 微 指令 ,第 二 种 是 字段 直接 译 码 法 水 平 型 微 指令 ,第 三 种 是 直接 表示 和 字段 译 码 相 混 
合 的 水 平 型 微 指令 。 

2) 垂直 型 微 指 人 

微 指令 中 设置 微 操作 码 字 段 , 米 用 微 择 作 人 码 编 详 法 来 规定 微 指令 功 能 的 微 指 令 , 称 为 秋 
直 型 微 指令 。 erp 构 类 似 于 机 器 指令 的 结构 , 它 有 微 操作 码 , 在 一 条 微 指令 中 
只 定义 1 一 2 个 微 操 作 命 令 , 且 每 条 微 指 令 的 功能 人 简单。 因此 ,实现 一 条 机 颖 指令 的 微 程 友 
要 比 水 于 届 入 指令 编写 的 记 程 序 长 得 多 | 它 是 有 来 用 较 长 的 微 程序 绪 十 构 去 换取 较 短 的 微 指 令 3 


对 4 条 垂直 型 微 指令 的 微 指 令 格 式 加 以 说 明 。 设 微 指令 字 长 为 16 位 , 微 操 作 码 3 
位 ( 占 高 3 位 ), 可 最 多 定义 8 种 类 型 的 微 指令 ,只 将 其 中 典型 的 4 种 列 出 。 
JU 寄存 占 - 寄 存 句 传送 型 微 指 令 
寄存 瞻 - 寄存 器 传送 型 微 指令 的 格式 如 图 7-38 所 示 。 


13 13 12 


3 2 0 
”000 |  ” 源 寄 存 器 编 直 目标 寄存 器 编 址 


图 7-38 ”寄存 器 -寄存 器 传送 型 微 指令 的 格式 


其 功能 是 把 源 寄存 表 数 据 送 目标 寄存 船 。 其 中 13 一 15 位 为 微 操 作 码 (下 同 ); 源 寄存 
租 和 目标 寄存 天 编 址 各 5 位 ,可 指定 31 个 寄存 表 之 一 ; 第 0 一 第 2 位 是 其 他 字段 ,可 协助 本 
条 微 指 令 元 成 内 他 控制 功能 。 

运算 控制 型 微 指 令 。 


运算 控制 型 微 指令 的 格式 如 图 7-39 所 示 。 


1 > 13 12 8 1/ 3 2 0 


其 功能 是 选择 ALU 的 左右 两 输入 源 信 息 , 按 ALU 字段 , 即 第 0 一 第 2 位 所 指定 的 8 
种 运算 操作 中 的 一 种 功能 进行 处 理 , 并 将 结果 送 入 暂 存 器 中 。 左 , 布 输 入 源 编 址 可 指定 31 
种 信息 源 之 一 。 

访问 主 存 微 指令 

访问 主 存 微 指 令 的 格式 如 图 7-40 所 示 。 
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] 3 13 12 
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图 7-40 ”访问 主 存 微 指令 的 格式 


其 功能 是 将 主 存 中 一 个 单元 的 信息 送信 寄存 硕 或 者 将 寄存 天 的 数据 送 往 主 存 。 其 中 ， 
存储 天 编 址 是 指 按 规定 的 寻 址 方式 进行 编 址 。 第 1. 种 2 位 指定 谈 操 作 或 写 操作 ,种 0 位 可 
协助 本 条 微 指 令 完 成 其 他 控制 功能 。 

4) 条 件 转移 微 指令 。 

条 件 转 移 微 指令 的 格式 如 图 7-41 所 示 。 


1 3 13 12 4 3 () 


到 7-41 条件 转 移 微 指令 的 格式 


其 功能 是 根据 测试 对 象 的 状态 决定 是 转移 到 D 所 指定 的 征地 址 单元 ,还 是 顺序 执行 下 

一 条 微 指令 。9 位 DD 字段 不 足以 表示 一 个 完整 ply 但 可 以 用 来 替代 现行 PC 的 低位 

地 址 。 测 试 条 件 字 段 有 4 位 ,可 规定 16 种 测试 条 件 。| 除 了 这 4 种 类 型 的 微 指 令 之 外 ,还 有 
移 位 控制 型 微 指令 无 条 件 转 移 微 指令 .其 他 微 指令 等 ， 


2. 水 平 型 微 指令 与 垂直 型 微 指 令 的 比较 


(1) 水 平 型 微 指令 并 行 操 作 能 力 强 ,效率 局, 灵活 性 强 ; 垂直 型 微 指 令 则 较 差 。 

在 一 条 水 平 型 微 指令 中 ,设置 有 控制 机 各 中 信息 传送 通路 以 及 进行 上 所有 操作 的 微 命令 ， 
因此 在 进行 微 程序 衣 计 时 ,可 以 同时 定义 比较 多 地 并 行 操作 的 微 命 令 ,控制 尽 可 能 多 地 并 行 
信息 传送 ,从 而 使 水 平 型 微 指令 具有 效率 高 及 灵活 性 强 的 优点 。 

在 一 条 垩 和 卫 型 微 指令 中 ,一 般 只 能 完成 一 个 微 操作 ,控制 一 两 个 信息 传送 通路 ,因此 重 
百 型 微 指 令 的 并 行 操 作 能 力 弱 ,效率 低 。 

(2) 水 平 型 微 指令 执行 一 条 机 各 指令 的 时 间 短 ,垂直 型 微 指令 执行 的 时 间 长 。 

因为 水 平 型 微 指令 的 并 行 操 作 能 力 强 ,因此 与 垂直 型 微 指 令 相 比 , 可 以 用 较 少 的 微 指 令 
数 来 实现 一 条 机 和 需 指 令 的 功能 ,从 而 缩短 了 机 需 指 令 的 执行 时 间 。 而 且 当 执行 一 条 微 指 令 
时 ,水 平 型 微 指令 的 微 命 令 一 般 和 直接 控制 对 象 , 而 垂直 型 微 指令 要 经 过 幸 人 码 也 会 影 啊 速度。 

(3) 由 水 平 型 微 指令 解释 指令 的 微 程序 ,具有 微 指 令 字 长 比较 长 ,而 微 程序 较 短 的 特 


点 。 垂 直 型 微 指令 则 相反 , 微 指 令 字 比 较 短 而 征程 序 较 长 。 
(4) 水 平 型 微 指令 用 户 难以 掌握 ,而 垂直 型 微 指令 与 机 器 指令 比较 相似 ,相对 来 说 较 容 


水 平 型 微 指令 与 机 器 指令 差别 很 大 ,一 般 需 要 对 机 器 的 结构 、 数 据 通 路 、 时 序 系统 以 及 
微 命令 很 精通 才能 进行 设计 。 对 机 器 已 有 的 指令 系统 进行 微 程序 设计 是 设计 人 员 而 不 是 用 
户 的 事情 ,因此 这 一 特点 对 用 户 来 讲 并 不 重要 ,然而 某 些 计算 机 人 允许 用 户 自行 设计 并 扩充 指 
邻 系统 ,此 时 就 要 注意 是 否 容易 编写 微 程序 的 问题 。 

实际 上 ,水 平 型 和 垂直 型 微 指 令 两 者 之 间 并 无 明确 的 界限 ,一 台 机 需 的 微 指令 也 往往 不 
局 限于 一 种 类 型 的 微 指 令 。 混 合 型 微 指令 兼 有 两 者 的 特点 , 它 可 以 采用 不 太 长 的 微 指令 又 
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具有 一 定 的 并 行 控制 能 力 ,但 微 指 令 格 式 相对 复 灯 。 
3. 串 行 徽 程序 控制 方式 和 井 行 做 程序 控制 方式 


1) 串 行 微 程 序 控制 方式 

在 前 面 所 讲 微 程序 控制 方式 都 属于 串 行 微 程序 控制 方式 ,所 谓 串 行 微 程 序 控 制 方式 ,在 
执行 当前 微 指令 与 取 下 一 条 微 指 令 在 时 间 上 是 顺序 进行 的 , 即 只 有 当 现 行 币 指令 执行 完毕 

条 微 指 令 ,如 图 7-42(a) 所 示 。 
了 短程 控制 中 , 微 指 令 周 期 等 于 取 指 令 的 时 间 加 上 执行 微 指 令 时 间 之 和 , 即 等 于 只 读 

存储 各 的 读 周 期 。 串 行 微 程序 控制 的 微 指 令 周 期 较 长 ,但 控制 简单 ,形成 微 地 址 的 便 件 较 少 。 

2) 并 行 微 程 序 控制 方式 

对 为 在 微 指令 周期 中 , 取 微 指令 和 执行 微 指令 分 别 由 不 同 的 计算 机 硬件 来 完成 ,不 同 的 
微 指 令 的 取 指 令 和 执行 指令 周期 之 间 可 以 重奏 5( 即 并 行 工 作 ) ,以 缩短 微 指 令 周 期 。 所 谓 并 
行 微 程序 控制 方式 ,就 是 将 取 微 指令 和 执行 微 指 令 这 两 类 操作 在 时 间 上 重 登 并 行进 行 的 方 
式 , 如 图 7-42(b) 所 示 。 

第 i 条 微 指令 周期 z 第 it1 条 微 指 令 周期 


| 
执行 第 交 执行 第 站 1 条 


(a) 串 行 微 程 夺 探 制 方式 


第 这 做 指令 周期 _ 串 计 1 条 做 指令 周期 |， 种 计 2 条 做 指令 周期 第 计 3 条 短 指 令 周 期 
执行 绅 i 洒 


ET 


(b) 并 行 微 程序 控制 方式 
图 7-42 ”品行 微 程序 控制 和 并 行 微 程序 控制 方式 


在 并 行 微 程序 控制 方式 中 ,要 求 在 执行 本 条 微 指令 的 同时 , 预 取 下 一 条 微 指令 ,从 而 微 
指令 周期 仅 等 于 执行 微 操 作 的 时 间 , 可 以 贡 约 取 微 指令 的 时 间 。 并 行 微 程序 控制 可 以 缩短 
微 指 令 周 期 ,但 是 ,为 了 不 影 啊 本 条 微 指 令 的 正确 执行 ,需要 增加 一 个 徽 指 令 寄 存 善 。 


4. 动态 微 程序 设计 


微 程 序 设 计 技 术 还 有 静态 征程 序 设计 和 动态 微 程 序 设 计 之 分 。 若 一 台 计 算 机 的 机 器 指 
令 只 有 一 组 微 程 序 , 而 且 这 一 组 微 程序 设计 好 之 后 ,一般 无 须 改变 而 且 也 不 好 改变 ,这 种 微 
程序 设计 技术 称 为 静态 微 程 序 设计 。 本 市 前 面 讲述 的 内 容 基 本 上 属于 静态 微 程序 设计 的 权 
ph < 用 EPROM 作为 控制 存储 冀 时 ,还 可 以 通过 改变 微 指 令 和 外 nh 区 机 全 站 
令 系 统 , 这 种 微 程序 设计 技术 称 为 动态 微 程 序 设 计 。 及 用 动态 微 程 , 微 后 和 
序 可 以 根据 需 要 加 以 改变 ,因而 可 以 在 一 台 机 器 上 实现 不 同类 型 的 指令 系统 这 种 技术 
称 为 仿真 其 他 机 器 指令 系统 ,以 便 扩 大 机 器 的 功能 。 

【 例 7.4】 某 微 程序 控制 器 中 ,采用 水 平 型 直 接 控制 微 指令 格式 断定 方式 。 已 知 全 机 
共有 微 命令 20 个 ,可 判定 的 外 部 条 件 有 4 个 ,控制 存储 帮 容 量 为 256X32 位 。 
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(1) 设计 出 微 指令 的 具体 格式 ; 

(2) 画 出 该 控制 右 的 结构 框图 。 

解 : 

(1) 微 命令 20 个 ,采用 水 平 型 直接 控制 ,所 以 操作 控制 字段 需 20 位 。 可 判定 的 外 部 条 
件 有 4 个 ,所 以 判别 测试 字段 为 4 位 ,控制 存储 天 容量 为 256 个 单元 ,所 以 下 地 址 学 段 需 8 
位 。 由 于 控制 存储 冀 的 字 长 为 32 位 。 操 作 控 制 字段 用 直接 表示 法 , 微 指 令 格 式 如 图 7-43 
所 示 。 


操作 控制 字段 判别 测试 下 地 址 字段 
图 7-43 微 指令 的 格式 


(2) 对 应 上 述 微 命令 格式 的 短程 厅 控 制 右 好 辑 框 图 ,如 图 7-44 所 示 。 其 中 , 微 地 址 寄 
和 存 冀 对 应 下 地 址 字段 ,P 字段 为 判别 测试 学 段 。 地 址 转移 逻辑 的 输入 是 指令 寄存 硕 操 作 公 ， 
各 状态 条 件 以 及 判别 测试 字段 所 给 的 判别 标志 ( 菏 一 位 为 1) ,其 输入 修改 地 址 寄存 着 的 适 


短 华 令 信 与 


操作 控 人 


UIR | 字段 


下 地 址 字段 


控制 存储 器 
(Nl 


微 地 址 


\ 形成 逻辑 
LAR 微 地 址 


证 浪 济 


制 器 的 逻辑 框图 


图 7-44 ” 微 程序 : 


g. 7 典型 CPU 及 主要 技术 


前 面 的 各 个 革 广 中 ,已 经 介绍 CPU 的 基本 组 成 部 分 、 工 作 原 理 及 设计 原理 。 下 面 将 以 


Intel 公司 的 X86 CPU 为 主线 ,以 Pentium 4 CPU 为 例 ,简要 介绍 它们 的 结构 ,技术 和 原理 。 
71.71.1 lIntel CPU 
1. 80x86 CPU 
1971 年 , 尚 处 于 发 展 阶 段 的 Intel 公司 推出 了 世界 上 第 一 个 微 处 理 器 4004。 它 是 第 一 
个 用 于 计算 器 的 4 位 微 处 理 器 。 虽 然 微 处 理 器 中 仅 集 成 了 2300 个 晶体管 ,速度 很 慢 且 功能 


有 限 , 但 是 它 是 划时代 的 产品 。 


1978 一 1989 年 ,Intel 公司 相继 推出 了 8086、80286、80386、80486 的 CPU , 字 长 从 16 位 
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增加 到 32 位 ,时 钟 频率 从 8086 的 4.77MHz 提高 到 80486 的 100MHz, 集 成 度 突破 了 100 
万 个 品 体 管 的 界限 ,80486 集成 了 120 万 个 晶体 管 。 随 看 CPU 技术 的 不 断 发 展 ,Intel 公司 
陆续 人 研制 出 新 型 多 球 CPU ,为 了 保证 计算 机 能 继续 运行 以 往 开 发 的 各 类 应 用 程 厅 ,保护 和 
继承 丰富 的 软件 资源 ,后 续 的 CPU 仍 使 用 x86 的 基本 指令 集 ,从 而 形成 了 今天 庞大 的 兼容 
CPU 系列 。 


2. Pentium 系列 CPU 


1993 年 ,Intel 公司 继 80486 之 后 推出 一 种 新 的 高 速 微 处 理 亲 Pentium ,也 就 是 人 们 
所 鸭 悉 的 “奔腾 "处理 表 , 它 内 合唱 体 管 320 万 个 , 主 频 100/133/166MHz。 

为 了 提高 CPU 的 性 能 ,Pentium CPU 来 用 了 下 列 技术 。 

1) 超标 量 流水 线 

超标 量 流水 线 指 的 是 处 理 右 中 有 多 条 流水 线 , 并 且 在 每 个 时 钟 周 期 中 可 同时 获取 一 条 
以 上 的 指令 进行 处 理 。 

Pentium 采用 了 超标 量 设计 方 法 , 它 围 纸 两 组 通用 寄存 化 设置 了 两 条 并 行 的 整数 流水 
线 , 即 UU 指令 流水 线 与 V 指令 流水 线 。 DU 流水线 可 执行 了 折 有 整数 与 浮 点 数 的 指令 ,V 流水 
线 则 可 执行 食 单 的 整数 指令 与 FXCH( 交 换 寄 存 副 内 容 ) 的 浮 点 数 指令 , 且 每 条 流水 线 部 有 
月 己 独 立 的 算术 逻辑 单元 、 地 址 生成 电路 和 数据 融 速 缓冲 存储 一 接口。 这 种 设计 使 得 在 最 
佳 的 状况 下 ,Pentium 可 以 在 一 个 时 钟 周 期 内 同时 并 行 地 执行 两 条 基本 简单 指令 , 比 相 同时 
钟 频率 的 80486DX 的 性 能 提高 了 一 倍 。 另外 ,在 Pentium 中 还 设置 了 一 个 浮 点 处 理 器 
CFPU) ,其 内 部 具有 专用 加 、 乘 、 除 运算 其 。 

2) 智能 动态 分 文 预 测 

智能 动态 分 文 预 测 是 指 在 指令 队列 中 ,事先 决定 一 个 具体 的 分 文 指 令 是 否 详 该 馈 
行 一 一 即 改 变 程 序 流 回 的 一 种 处 理 冀 的 猜测” 技术。 

Pentium 中 提供 了 一 个 小 的 cache 分 支 目 标 缕 冲 莫 (Branch Target Buffer,BTB) 来 
动态 预测 程序 的 分 文 。 当 一 条 指令 导致 程序 分 文 时 ,BTB 记忆 这 条 指令 和 分 文 的 目标 地 
址 ,并 根据 这 些 信 息 来 预测 这 条 指令 再 次 产生 分 文 时 的 路 径 ,然后 直接 从 该 处 * 预 取 ” 指 令 ， 
保证 流水 线 进 行 正 稼 的 "指令 预 取 ”。 

3) 数据 和 指令 分 离 的 一 级 cache 

及 用 双重 分 离 式 高 速 缓冲 存储 则 设 计 。Pentium 心 片 内 有 两 个 8KB 的 高 速 缓冲 存储 
入 ,一 个 用 于 存放 指令 ,万 一 个 用 于 存放 数据 , 即 双 路 高 速 缓冲 结构 ,这 种 结构 可 以 减少 高 速 
缓 训 人 存储 佣 发 生 委 用 的 情况 ,并 且 两 组 存储 甫 在 需要 时 可 随时 提供 服务 ,元 分 改善 了 微 处 理 
的 性 能 。 数 据 cache 有 两 个 接口 ,分 别 接 U、V 流水 线 ,cache 写 操作 和 主 存 写 操作 同时 进行 , 保 
证 了 数据 的 一 致 性 。 指 令 cache 采用 256 位 总 线 同 指令 预 取 缓冲 着 连接 ,一 次 可 取 32 字 玫 的 
指令 操作 码 , 从 而 大 大 加 快 了 指令 的 预 取 速度 。CPU 可 以 同时 访问 两 种 融 速 缓冲 存储 融 。 

4) 总 线 耕 吐 能 力 的 增强 

Pentium 的 内 部 寄存 机 和 数据 总 线 仍 为 32 位 ,外 部 数据 总 线 则 为 64 位 , 即 微 处 理 磊 与 
内 存 或 W/O 设备 进行 数据 交换 时 的 数据 总 线 的 宽度 为 64 位 ,这 样 可 使 数据 传输 能 力 高 达 
528MB/s ,是 80486 的 数据 传输 能 力 (105MB/s) 的 5 倍 , 有 效 地 平衡 了 外 部 数据 传输 慢 而 
CPU 内 部 数据 传输 快 的 矛盾 ,提高 了 CPU 的 性 能 。 
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5) 处 理 右 性 能 的 增强 
在 Pentium 的 整数 模块 中 ,常用 指令 (如 MOV DEC、PUSH POP 等 指令 ) 改 用 硬件 实 
现 。 同 时 对 指令 系统 的 微 码 做 了 重大 的 改进 ,使 指令 周期 比 80486 大 大 缩短 。 

浮 点 单元 采用 独立 的 8 级 流水 线 FPU ,平均 每 个 时 钟 半期 完成 一 条 浮 点 运算 
元 一 些 常 用 的 指令 (如 ADD、MUL、LOAD 等 ) 用 硬件 实现 。 

继 Pentium 之 后 ,Intel 公司 又 相继 推出 Pentium Pro, Pentium MMX. Pentium 工 、 
Pentium ll| Pentium 4 CPU 。 

Pentium Pro 是 Intel 公司 于 1995 年 11 月 推出 的 新 一 代 忆 性 能 处 理 带 一 一 高 能 奔腾 处 
理 带 ,代号 为 P6。 采 用 32 位 寄存 大 .64 位 外 部 数据 总 线 和 36 位 地 址 总 线 。 并 在 Pentium 
Pro 处 理 融 基础 上 采用 了 超标 量 .14 级 超级 流水 线 设 计 , 支 持 乱 友 执 行 ,具有 分 支 预 测 功 能 
和 推测 执行 功能 。 它 内 含 三 条 流水 线 , 将 80x86 的 指令 分 解 转 换 成 RISC 型 微 操 作 , 即 一 个 
时 钟 周 期 内 可 处 理 三 条 80x86 指令 ,日 Pentium Pro 片 内 集成 7 了 了 256KB L2 高 速 缓存 ,使 性 
能 得 到 了 进一步 的 提高 。 

Pentium MMX 是 一 种 能 和 直接 进行 多 媒体 信息 处 理 的 高 效 处 理 右 ,这 球 人 处理 兹 并 没有 
集成 二 级 缓存 ,而 是 采用 MMX 技术 来 增强 性 能 。MMX(MultiMedia eXtention) 也 可 翻译 
为 “多 媒体 扩展 指令 集 ”, 是 Intel 公司 为 增强 奔腾 CPU 在 音像 .图形 和 通信 和 应 用 方面 发 明 的 
一 项 多 媒体 增强 指令 集 技术 。MMX 处 理 髓 在 原来 x86 指令 集 的 基础 上 又 扩展 了 57 条 指 
令 , 主 要 用 于 加 速 多 媒体 任务 的 执行 。 

1998 年 ,为 抢占 低 吧 市场, Intel 推出 了 性 价 比较 高 的 Celeron( 园 扬 处 理 胡 )。 有 天 
Celeron,Pentium | 、Pentium 由 的 特性 ,读者 上 月 已 可 参考 相关 资料 。 

2000 年 Intel 发 布 了 了 Pentium 4 处 理 闫 。Pentium 4 处 理 表 集成 了 4200 万 个 晶体 管 ,到 
了 改进 版 的 Pentium 4(Northwood) 更 是 集成 了 了 5500 万 个 品 人 管 ; 并 且 开 始 来 用 0. 18um 
进行 制造 ,初始 速度 就 达到 了 1. 5GHz。Pentium 4 还 提供 的 SSE2 指令 集 , 这 套 指 令 集 增 加 
144 个 全 新 的 指令 。 

2003 年 Intel 发 布 了 了 Pentium M(Mobile) 处 理 需 。Pentium M 处 理 器 可 提供 高 达 
1. 60GHz 的 主 频 速 度 , 并 包含 各 种 效能 增强 功能 ,如 最 佳 化 电源 的 400MHz 系统 总 线 、 微 处 
理 作 业 的 融合 (Micro-OpsFusion) 和 专门 的 堆栈 管理 胡 (Dedicated Stack Manasger) ,这 些 工 
有 具 可 以 快速 执行 指令 集 并 市 省 电力 。 

2005 年 Intel 推出 的 双核 人 处理 器 有 Pentium D 和 Pentium Extreme Edition,; 同 时 推出 
945/955/965/975 忌 片 组 来 支持 新 推出 的 双核 处 理 器 。Pentium D 处 理 咒 使 用 Prescott 架 
构 及 90nm 生产 技术 生产 ,其 内 核实 际 上 由 两 个 独立 的 Prescott 核心 组 成 ,每 个 核心 拥有 独 
立 的 1MB L2 缓存 及 执行 单元 。 由 于 处 理 血 中 的 两 个 核心 部 拥有 独立 的 缓存 ;因此 必须 保 
证 每 个 二 级 缓存 当中 的 信息 完全 一 致 ,否则 就 会 出 现 运 算 错 误 。 

单 核心 的 Pentium 4 、Pentium 4 EE Celeron D 以 及 双核 的 Pentium D 和 Pentium EE 
等 CPU 及 用 LGA 775 封 狠 。 与 以 前 的 Socket 478 接口 CPU 不 同 ,LGA 775 接口 CPU 的 
左 部 没有 传统 的 针脚 ,而 代 之 以 775 个 触 点 , 即 并 非 针 脚 式 而 是 触 点 式 , 通 过 与 对 应 的 LGA 
775 捅 槽 内 的 775 根 触 针 接 触 来 传输 信号 。LGA 775 接口 不 仪 能 够 有 效 提 升 处 理 器 的 信号 
蝇 度 .提升 处 理 生 频率 ,同时 也 可 以 提高 处 理 表 生产 的 民品 率 、 降 低 生 产 成 本 。 
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3. Intel Core( 酷 突 )CPU 


2005 年 至 今 是 Intel Core( 酷 害 ) 系 列 微 处 理 器 时 代 。“ 酷 害 " 是 一 款 节能 的 新 型 微 架 
构 ,设计 的 出 发 点 是 提供 出 众 的 性 能 和 能 歼 。 

2006 年 7 月 27 日 ,Intel 发 布 Core 2 Duo( 酮 寄 2)。 柄 蹇 2 是 英特尔 基于 Core 微 架 构 
的 产品 体系 统称 , 它 是 一 个 中 平台 的 构架 体系 ,包括 服务 冀 版 ., 果 面 版 .移动 版 二 大 领域 。 其 
中 ,服务 器 版 的 开发 代号 为 Woodcrest, 时 面 版 的 开发 代号 为 Conroe, 移 动 版 的 开发 代号 为 
Merom 。 

继 LGA 775 接口 之 后 ,Intel 首先 推出 了 LGA 1366 平台 ,定位 高 端 应 用 。 前 个 米 用 
LGA 1366 接口 的 处 理 旨 代 号 为 Bloomfield ,采用 经 改良 的 Nehalem 核心 ,基于 45nm 制程 
及 原生 四 核心 设计 ,内 建 8 一 12MB 三 级 缓 仔 。LGA 1366 接口 的 处 理 表 主要 包括 45nm 
Bloomfield 核心 栈 窒 17 四 核 人 处 理 问 。 随 着 Intel 在 2010 年 迈 人 32nm 工艺 制程 ,高 问 应 用 
的 代表 被 酯 罕 17-980X 处 理 天 取代 ,全 新 的 32nm 工艺 解决 六 核心 搁 术 ,拥有 最 强大 的 性 能 

Core i5 是 一 款 基 于 Nehalem 架构 的 四 核 处 理 占 ,采用 整合 内 存 控 制 嚣 ,L3 达到 8MB， 
有 来 用 的 是 成 玖 的 DMI(Direct Media Interface) 总 线 , 只 文 持 双 通道 的 DDR3 内 存 , 采 用 
LGA 1156 接口 ,32nm 工艺 制程 ,主流 级 别 的 代表 有 了 酷 窒 15-650/760。 

Core i3 可 看 作 Core i5 的 进一步 精 催 版 (或 阀 割 版 ) ,有 32nm 工艺 版 本 (全 发 代号 为 
Clarkdale, 基 于 Westmere 架构 )。Core i3 最 大 的 特点 是 整合 GPU( 图 形 处 理 硕 ), 由 
CPU 十 GPU 两 个 核心 封 波 而 成 ,代表 产品 有 酷 窒 13-530/540。 

2010 年 6 月 ,Intel 发 布 了 第 二 代 Core i3/i5/i7。 第 二 代 Core i3/i5/i7 基于 全 新 的 
Sandy Bridge 微 架 构 , 它 是 取代 Nehalem 的 一 种 新 的 微 染 构 , 玉 用 32nm 工艺 制程 ,全 新 
LGA 1155 接口 设计 。 相 比 第 一 代 产 品 主要 市 来 五 点 重要 结 新 : 米 用 全 新 32nm 的 Sandy 
Bridge 微软 构 ,更 低 功 耗 、, 更 强 性 能 。 内 置 高 性 能 GPU (核心 显卡 ), 视 频 编 码 、 图 形 性 能 更 
蝇 。 蹇 频 加 速 技术 2.0, 更 智能 、 更 高 效能 。 引 入 全 新 环形 架构 ,市 来 更 高 市 宽 与 更 低 延 迟 。 
全 新 的 AVX、AES 指令 集 , 加 强 浮 点 运算 与 加 密 解 密 运 算 。 

2012 年 4 月 Intel 正式 发 布 了 Ivy Bridge(IVB) 处 理 器 。 采 用 22nm 工艺 制程 ,3D 品 体 
管 技 术 ,使 CPU 耗 电 量 减 少 一 半 ,继续 使 用 LGA 1155 接口 。 

2013 年 6 月 Intel 发 布 了 基于 Haswell 架构 的 新 处 理 带 ,Haswell 架构 是 用 以 取代 
Intel Ivy Bridge 和 Intel Sandy Bridge 微 架 构 的 。Haswell 和 Ivy Bridge 微 架 构 一 样 ,采用 
22nm 制程 ,整体 性 能 将 比 Ivy Bridge 快 两 倍 。 

2014 年 8 月 ,Intel 正式 发 布 了 全 新 14nm 也 片 技术 ,并 将 其 命名 为 Broadwell。 在 笔记 
本 和 平板 市 场 ,这 些 产 品 将 被 称 做 “ 酷 寄 M”。 配 备 了 Broadwell 沪 片 (比如 酷 寄 M) 的 平板 
电脑 仅 有 3 一 5W 的 功 耗 ,而 纤 薄 的 设计 意味 着 可 消除 CPU 的 散热 风 书 。 在 图 形 性 能 方面 ， 
Broadwell 的 计算 性 能 和 采样 相 比 Haswell 分 别提 升 了 20% 和 50% ,而 视频 质量 引擎 的 提 
升 更 是 达到 了 后 者 的 两 信 ，。 


7.7.2 Pentium 4 的 结构 


2000 年 Intel 发 布 的 Pentium 4 处 理 天 集成 了 4200 万 个 品 体 管 , 到 了 改进 版 的 
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Pentium 4(Northwood) 集 成 了 5500 万 个 晶体 管 ,开始 采用 0. 18um 工艺 制造 ,初始 速度 就 
达到 了 1.5GHz。Pentium 4 也 有 对 应 型 号 的 Celeron 处 理 融 ,来 应 对 低 咒 市 场 。Socket 
478 接口 是 Pentium 4 系列 处 理 占 所 采用 的 接口 类 型 ,针脚 数 ; 
接口 的 Pentium 4 处 理 右 如 图 7-45 所 示 。 
基于 Pentium 4 处 理 融 的 个 人 电脑 ,可 以 让 用 户 创 
片 , 透 过 因特网 传递 电视 品质 的 影像 ， 
像 通 信 , 实 时 3D 泻 染 ,快速 进行 
运算 ,在 连接 因特网 时 运行 多 个 多 媒体 


软件 。 

Pentium 4 是 一 款 IA-32 体系 结构 的 32 位 微 人 处 理 
丰 , 也 是 第 一 款 基 于 Intel NetBurst (Intel Micro- 
向 处 理 融 ,其 逻辑 功能 图 如 图 7-46 所 示 。 


architecture) 贫 


总 线 接口 单元 64 位 100MHz4 倍 速 3.2GBAs 一》 系统 总 线 


L2 绥 和 存 / 绥 人 存 控制 单元 。 
| 2561 全 妹 


指令 TLB 处 动态 分 文 预测 研 4096 个 人 口 


眼 昧 级 存 分 支 观 测 : 
4096 个 入 口 的 BTB 


执行 跟踪 缓存 
1200 个 LOPs 


里 排 友 纵 促 区 
ROB 


排 序 蔡 


质 源 分 配 / 寄 仔 蔡 荫 名 


整 型 / 浮 点 HOP 队列 存储 MOP 队列 


整数 运算 寄存 着 文件 


浮 点 运算 寄存 器 文件 
旁 路 网 络 和 


便 件 数据 预 取 8K 于 下 ，4 上 咯 ， 双 师 口 


逻辑 功能 


2561{ 全 速 
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(1) 在 Pentium 4 中 采用 了 一 项 非常 重要 的 技术 : 流 式 SIMD 扩展 2 技术 (SSE2) 。 

SSE2 进一步 对 MMX 技术 和 SSE 扩展 进行 了 增强 。 新 增加 了 144 条 SIMD 指令 Ws 
括 浮 点 SIMD 指令 、 整 型 SIMD 指令 、SIMD 浮 点 数 和 SIMD 整 型 数 相互 转换 的 指令 
在 XMM 和 MMX 寄存 器 之 间 的 紧缩 数据 转换 指令 。SSE2 可 同时 使 用 以 下 F 类 型 的 数 : 
4 个 单 精度 浮 点 数 、2 个 双 精 度 浮 点 数 、16 个 字 节 整数 、8 个 字 整 数 、4 个 双 字 整 数 、 2 个 四 倍 
字 整 数 ,1 个 128 位 的 整数 ， 

丰富 的 数据 类 型 和 新 增加 的 SSE2 指令 集 大 大 提高 了 Pentium 4 对 多 媒体 信息 的 处 理 
能 力 。 除 了 新 增 的 128 位 SIMD 指令 外 ,Pentium 4 还 兼容 原来 的 68 条 SIMD 指令 . 并 能 使 
它们 以 更 高 的 速度 进行 运算 。 且 SSE2 中 还 扩展 了 几 条 新 的 指令 人 允许 程序 员 控 制 数据 的 可 
缓存 能 力 。 

(2) Intel NetBurst 微 体 系 结构 。 

J 快速 执行 引擎 。Pentium 4 中 有 两 组 2 倍速 的 ALU 及 两 组 2 倍速 的 AGU ,一 个 用 
于 存储 地 址 的 生成 ,一 个 则 用 于 生成 读 取 地 址 。 另 外 还 有 一 个 慢 速 ALU 用 于 执行 复杂 运 
算 指 令 。4 个 ALU 和 AGU 均 可 在 一 个 时 钟 周 期 内 执行 两 次 基本 的 整 型 运算 ,其 执行 速度 
可 达 CPU 主 频 的 2 售 。 

超 流 水 线 技术 。Pentium 4 具有 20 级 的 流水 线 , 它 能 使 所 有 部 件 以 极 高 的 时 钟 频率 
全 速 运 行 。 

高 级 动态 执行 。 乱 序 推测 执行 引擎 保证 同时 执行 的 指令 高 达 126 条 ,流水 线 可 同时 
执行 48 个 读 操 作 和 24 个 写 操 作 。 且 增 吕 了 分 文 预测 的 能 力 , 采 用 的 分 文 预测 算法 使 准确 
度 大 大 提高 ,分支 目标 缓存 中 的 入 口 地 址 可 达到 4096 个 ,并 降低 了 流水 线 以 预测 失败 时 必 
须 清除 整个 流水 线 造成 的 延迟 。 

(4) 新 型 缓存 体系 结构 。L1 缓存 包括 高 级 执行 跟踪 缓存 和 数据 缓存 。 其 中 高 级 执行 组 
存 用 来 存储 已 译 码 的 指令 ,并 把 程序 执行 的 控制 流 集中 到 一 个 单一 的 管线 中 ,消除 了 主 执行 
循环 的 译 码 延迟 。 而 8KB 的 数据 缓存 采用 了 4 路 联合 工作 方式 ,并 使 用 64 字 节 的 缓存 管 
道 , 延 退 时 间 低 。 

L2 缓存 ,Pentium 4 中 加 入 了 集成 的 256KB 的 L2 缓存 ,也 叫 高 级 传输 缓存 ,这 种 微 体 
系 结 构 从 Pentium Pro 开始 就 被 引信 IA-32 人 处理 句 中 ,也 称 为 P6 人 处理 笑 微 体 系 结构 ,如 
图 7-47 所 示 。L2 缓存 采用 8 路 联合 工作 方式 , 按 2X64 字 节 进行 组 织 , 信 息 传输 的 宽度 以 
64 字 市 为 单位 ,其 时 钟 频率 与 CPU 核心 相同 ,与 CPU 内 核 连接 的 总 线 宽 度 为 256 位 .能 实 
现 与 CPU 的 高 速配 合 。 

高 性 能 4 倍速 总 线 接口 。 

超标 量 并 行 执 行 机 制 。 

使 用 一 个 扩充 的 硬件 寄存 器 ,通过 重 命 名 避免 寄存 器 名 字 空 间 的 限制 。 

人 硬件 指令 预 取 。 硬 件 指令 预 取 部 件 能 识别 CPU 内 核 执 行程 序 的 信息 存 取 样本 ,并 
根据 样本 猜测 下 次 要 处 理 的 信息 ,将 其 预先 读 和 高速 缓存 中 。 

其 中 ,BTB(Branch Target Buffer) 是 一 个 分 文 目 标 缓冲 区 ,用 来 存放 预测 分 文 的 所 有 
可 能 目的 地 址 。AGU(Addreess Generation Unit) 即 地 址 产 牛 单元 , 它 负 责 决 定 信 息 存 取 的 
正确 地 址 。 控 存 中 存放 的 微 指令 的 长 度 是 固定 的 ,很 容易 在 执行 流水 线 中 处 理 。 指 令 诺 三 
做 则 负责 将 机 需 指 令 转 换 成 一 条 或 多 条 微 指 令 。 
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图 7-47 P6 处 理 器 微 体系 结构 


知识 拓展 
GPU 与 CPU 

GPU(CGraphic Processing Unit) 即 图 像 处 理 器 , 它 是 显卡 的 “心脏 ”, 它 决定 了 显卡 的 大 
部 分 性 能 。NVIDIA 公司 在 1999 年 发 布 GeForce256 图 形 处 理 芯 片 时 首先 提出 GPU 的 概 
念 。GPU 能 够 从 硬件 上 支持 多 边 形 转换 与 光源 处 理 , 计 算 多 边 形 的 3D 位 置 和 处 理 动 态 光 
线 效 果 , 也 可 以 称 为 “几何 处 理 ?, 实 现 三 维 图 像 和 特效 处 理 功能 的 “硬件 加 速 ”。 

今天 ,GPU 已 经 不 再 局 限于 3D 图 形 处 理 了 ,GPU 通用 计算 技术 发 展 已 经 引起 业界 不 
少 的 关注 。 事 实 也 证 明 ,在 浮 点 运算 、 并 行 计算 等 部 分 计算 方面 ,GPU 可 以 提供 数 十 倍 乃至 
于 上 百倍 于 CPU 的 性 能 。GPU 通用 计算 方面 的 标准 目前 有 OPEN CL、CUDA.、ATI 
STREAM。 其 中 ,开放 计 和 上 语言 (Open Computing Language, QOpenCL) 是 第 一 个 面向 开 构 
系统 通用 目的 并 行 编程 的 开放 式 、 统 一 的 编程 环境 ,便于 软件 开发 人 员 为 高 性 能 计算 服务 
器 、 桌 面 计 算 系 统 . 手 持 设备 编写 高 效 轻便 的 代码 ,而 且 广 泛 适用 于 多 核心 处 理 器 (CPU)、 
图 形 处 理 器 (GPU) Cell 类 型 架构 以 及 数字 信号 处 理 器 (DSP) 等 其 他 并 行 处 理 器 ,在 游戏 、 
娱乐 科研、 医疗 等 各 种 领域 都 有 广阔 的 发 展 前 景 。 

虽然 GPU 能 完成 一 些 通用 计算 方面 的 任务 ,但 是 通用 CPU 所 能 完成 的 任务 是 GPU 
无 法 代替 的 ,因此 ,不 能 用 GPU 来 代 胡 CPU。JIntel 和 AMD 意识 到 今后 CPU 和 GPU 只 
有 走 一 条 融合 的 道路 才能 在 却 争 中 占 得 先 机 ，。 

微软 的 Windows 7 其 中 一 个 显著 特性 就 是 联合 GPU 和 CPU 的 强大 实力 ,组 成 了 协同 
处 理 环境 。CPU 运算 非常 复杂 的 序列 代码 ,而 GPU 则 运行 大 规模 并 行 应 用 程序 。 微 
用 DirectX Compute 将 GPU 作为 操作 系统 的 核心 组 成 部 分 之 一 ,DirectX Compute 就 是 微 
软 开 发 的 GPU 通用 计 身 接口 。 

Intel 发 布 的 酷 寄 二 代 Sandy Bridge 处 理 器 完整 融合 GPU 和 CPU 在 一 块 芯 片上 ,显示 
核心 将 与 CPU 共用 L3 高 速 缓存 ; AMD Llano APU 已 经 将 集成 显卡 提升 到 了 一 个 新 的 高 
度 。JIntel Ivy Bridge 架构 处 理 器 的 集成 显示 核心 升格 为 Intel HD Graphics 2500/4000, 有 
6 一 16 个 EU( 运 行 单元 ), 人 全面 支持 DirectX 11、 OpenGL 3.1 和 OpenCL 1.1。 Intel 
Haswell 微 架构 处 理 器 的 自 市 GPU 的 性 能 可 媲美 同时 代 售 价 50 一 70 美元 的 独立 显示 核心 。 
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2014 年 8 月 ,Intel 发 布 了 14nm 工艺 技术 的 芯片 ,并 将 其 命名 为 Broadwell。 相 比 
Haswell,Broadwell 在 图 形 性 能 方面 得 到 了 大 幅 提 升 ,视频 质量 是 前 者 的 两 倍 , Broadwell 
上 起 片 将 支持 DirectX 11.2, 以 及 4K 和 UHD 分 辨认 。 


本 章 小 结 


本 和 曹 主要 讲述 了 以 下 内 容 : 

(1) CPU 是 计算 机 的 中 央 处 理 部 件 , 具 有 指令 控制 .操作 控制 .时 间 控 制 、. 数据 加 工 等 
基本 功能 。 

(2) 介绍 典型 CPU 的 组 成 .工作 原 理 及 特点 ,早期 的 CPU 由 运算 大 和 控制 兹 两 大 部 
分 组 成 。 随 看 高 密度 集成 电路 技术 的 发 展 ,当今 的 CPU 必 片 变 成 运算 骼 cache 和 控制 需 
三 大 部 分 ,其 中 还 包括 浮 点 运算 项 、 存 储 管 理 部 件 等 。CPU 至 少 要 有 以 下 6 类 寄存 项 : 指 
令 寄 人 存 善 .程序 计数 郑 、 地 址 寄存 毅 、 缓 冲 寄 人 存 姑 、 通 用 寄存 前 、 状态 条 件 寄 人 存 秀 。 

(3) CPU 从 存储 器 取出 一 条 指令 并 执行 这 条 指令 的 时 间 和 称 为 指令 周期 。 由 于 各 种 
指令 的 操作 功能 不 同 , 各 种 指令 的 指令 周期 是 不 尽 相 同 的 。 划 分 指令 周期 ,是 设计 操作 控制 

(4) 时 序 信号 产生 髓 提供 CPU 周期 (也 称 机 器 周期 ) 所 需 的 时 序 信 和 号。 操作 控制 髓 利 
用 这 些 时 序 信号 进行 定时 ,有 条 不 亲 地 取出 一 条 指令 并 执行 这 条 指令 。 

(5) 微 程 序 设 计 技 术 是 利用 软件 方法 设计 操作 控制 硕 的 一 门 技术 ,具有 规整 性 .灵活 
性 .可 维护 性 等 一 系列 优点 ,因而 在 计算 机 设计 中 得 到 了 广泛 的 应 用 ,并 取代 了 早期 采用 的 
人 硬 布 线 控 制 器 设计 技术 。 但 是 随 着 VLSI 技术 的 发 展 和 对 机 需 速 度 的 要 求 , 硬 布线 逻辑 设 
计 思 想 又 得 到 了 重视 。 硬 布线 控制 器 的 基本 思想 是 ; 某 一 微 操 作 控 制 信号 是 指令 操作 码 译 
码 输 出 、. 时 序 信号 和 状态 条 件 信 和 号 的 逻辑 函数 , 即 用 布尔 代数 写 出 逻辑 表达 式 , 然 后 用 门 电 
路 和 触发 硕 等 硕 件 实现 。 


习题 七 


一 、 名 词 解 释 
1. 指令 周期 2. 机 融 周 期 3. 时 钟 周 期 4. 节拍 
5. 微 操 作 6. 微 命 令 7. 微 程序 8. 微 指 令 
二 、 选 择 题 
1. 硬 布 线 控制 葵 也 称 为 ( ) 。 

A. 存储 逻辑 控制 项 B. 运算 天 

C. 微 程 序 控制 器 D. 组 合 逻辑 控制 大 
2. 相对 于 微 程序 控制 器 , 硬 布 线 控制 器 的 特点 是 ( )。(2009 年 全 国 硕 十 研究 生 人 

学 统考 计算 机 学 科 专 业 试 题 ) 
A. 指令 执行 速度 慢 ,指令 功能 的 修改 和 扩展 容易 
B. 指令 执行 速度 慢 ,指令 功能 的 修改 和 扩展 难 
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C. 指令 执行 速度 快 ,指令 功能 的 修改 和 扩展 容易 
D. 指令 执行 速度 快 ,指令 功能 的 修改 和 扩展 难 
3. 在 CPU 中 ,用 来 指定 下 一 条 要 执行 指令 的 地 址 的 寄存 大 是 ( ) 。 
A. 地 址 寄存 器 B. 指令 寄存 天 
C. 程序 计数 需 D. 状态 条 件 寄 人 存 融 
状态 条 件 寄存 右 的 主要 用 途 是 用 来 存放 ( 后 
A. 运算 类 型 
B. 逻辑 运算 结果 标志 
C. 算术 运算 结果 标志 
D. 算术 ,逻辑 运算 及 测试 指令 结果 标志 和 CPU 当前 的 状态 标志 
5. 一 般 来 说 ,和 微 指令 的 执行 周期 相对 应 的 是 ( ) 。 
A. 时 钟 周 期 B. 机 器 周期 C， 指令 周期 D. 节拍 周期 
6. 微 程 序 存放 在 ( ) 中 。 
A. 主 存储 着 B. 控制 存储 顺 C. 指令 寄存 顺 D. 通用 寄存 需 
7. 将 微 程 序 存储 在 E PROM 中 并 且 可 以 进行 修改 称 为 ( 人 
A. 表态 微 程 序 设计 B. 动态 微 程 序 设 计 
C. 汇编 程序 设计 D. 坚 微 程序 设计 
8. 在 微 程 序 控制 器 中 ,机 器 指令 和 微 指 令 的 关系 为 ( ) 
条 微 指令 由 奎 干 条 机 器 指令 组 成 
B. 每 条 机 右 指 令 由 一 条 微 指 令 解 释 执 行 
复 微 程序 由 一 条 机 费 指 令 解 释 执行 
D. 每 条 机 此 指令 由 一 段 微 指令 解释 执行 
9. 关于 微 指令 的 编码 方式 ,下 列 说 法 正确 的 是 ( ) 。 
A. 字段 编译 码 表 示 法 的 微 指 令 位 数 多 
B. 直接 表示 法 的 微 指令 位 数 多 
C， 直接 表示 法 和 字段 编译 人 码 表 示 法 
D. 以 上 说 法 虱 不 对 
10. 水 平 型 微 指令 和 垂直 型 微 指令 的 差别 在 于 ( ) 。 
A. 一 条 水 平 型 微 指令 只 能 完成 一 个 微 操作 
B. 一 条 垂直 型 微 指令 完成 多 个 并 行 微 操 作 
C. 两 者 都 能 一 次 完成 多 个 微 操 作 
D. 垂直 型 微 指 令 编 码 长 度 一 般 比 水 平 型 微 指 令 短 
11. 某 计 算 机 采用 微 程序 控制 器 ,共有 32 条 指令 ,公共 的 取 指 令 微 程序 包含 2 条 微 指 
令 , 各 指令 对 应 的 微 程序 平均 由 4 条 微 指令 组 成 ,采用 断定 法 (下 址 字段 法 ) 确 定 下 条 微 指令 
的 地 址 , 则 微 指令 中 下 址 字段 的 位 数 至 少 是 ( ) 位 。(2014 年 全 国 硕 士 研 究 生 人 学 统考 
计算 机 学 科 专 业 试题 ) 
A. 5 B. 6 C. 8 D. 9 
12. 某 计 算 机 的 控制 器 采用 微 程序 控制 占 方 式 , 微 指令 中 的 操作 控制 字段 采用 编译 人 码 
法 ,共有 33 个 微 命 令 ,构成 5 个 互 斥 类 ,分别 包含 7、.3、12.5 和 6 个 微 命令 ,操作 控制 字段 的 


不 影 啊 微 指 令 的 长 度 
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) 位 。(2012 年 全 国 硕士 研究 生 人 学 统考 计算 机 学 科 专 业 试 题 ) 
\, 5 B. 6 C. 15 D. 33 
13. 下 列 关于 RISC 的 叙述 中 ,错误 的 是 (  ”)。(2009 年 全 国 硕士 研究 生 人 学 统考 计 
算 机 学 科 专 业 试题 ) 
A. RISC 一 定 采 用 微 程 序 控制 天 
B，RISC 大 多 数 指令 的 执行 在 一 个 CPU 周期 内 完成 
C，RISC 的 内 部 通用 寄存 器 数量 相对 CISC 多 
D.， RISC 的 指令 数 、 寻 址 方式 和 指令 格式 种 类 相对 CISC 少 
、 综 合 题 
. CPU 的 基本 功能 是 什么 ,一 个 典型 的 CPU 至 少 由 哪些 部 件 组 成 ? 
试 对 微 程 序 控 制 医 和 硬 布 线 控制 器 进行 比较 。 
. 计算 机 为 什么 要 设置 时 序 系 统 , 说 明 指令 周期 、 机 器 
. CPU 的 控制 方式 有 了 哪 几 种 ? 试 说 明 它 们 的 特点 。 
5. 某 CPU 的 时 钟 频 率 为 100MHz, 其 时 钟 周期 是 多 少 ? 奢 已 知 每 个 机 各 周期 平均 包 
含 2 个 时 钟 周 期 ,该 机 的 平均 指令 执行 速度 为 25MIPS, 试 问 : 
(1) 平均 指令 周期 是 多 少 ns? 
(2) 平均 每 个 指令 周期 含有 多 少 个 机 各 周期 ? 
(3) 硅 要 得 到 50MIPS 的 指令 执行 速度 , 则 应 来 用 主 频 率 为 多 少 MHz 的 CPU 必 片 ? 
6. CPU 结构 如 图 7-48 所 示 ,其 中 有 一 个 素 加 寄存 和 CAC) ,一 个 状态 条 件 寄 人 存 关 ,各 
分 之 间 的 连 线 表 示 数 据 通 路 ,鼻头 表示 信息 传送 方 条 。 
(1) 标明 图 7-48 中 4 个 寄存 器 的 名 称 ; 
(2) 简 述 指令 从 主 存 取 到 控制 需 的 数据 通路 ; 
(3) 简 述 数据 在 运算 器 和 主 存 之 间 进 行 存 / 取 访 问 的 数据 通路 。 


期 及 时 钟 周 期 的 含义 。 


周 


癌 


主 存储 器 M 


操作 


控制 大 


状态 寄存 器 


图 7-48 CPU 的 结构 图 


7. 某 计算 机 有 以 下 部 件 : ALU 、 移 位 器 、 主 存 M 主 存 数据 寄存 器 MDR.、 主 存 地 址 寄存 
器 MAR ,指令 寄存 器 IR .通用 寄存 器 人 ,一 人; 、 暂 存 器 C 和 D( 见 图 7-49) 。 
(1) 请 将 各 逻辑 部 件 组 成 一 个 数据 通路 ,并 标明 数据 流 辐 ; 
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(2) 画 出 ADD Ri ,(R; ) 指 令 的 指令 周期 流程 图 ,指令 功能 是 (Ri) 十 ((R;,)) 一 Ri。 


M AR 


图 7-49 ”逻辑 部 件 


8. 图 7-50 为 双 总 线 结构 CPU 的 数据 通路 ,IR 为 指令 寄存 器 ,PC 为 程序 计数 器 (有 具 自 
增 功 能 ) ,M 为 主 存 ( 受 R/W 控制 ) ,AR 为 地 址 寄存 器 ,DR 为 数据 缓冲 寄存 器 ,ALU 由 加 、 
减 控 制 信 号 决定 完成 何 种 操作 ,G 控制 的 是 一 个 门 电 路 ,另外 的 输入 、 输 出 等 控制 信号 已 由 
图 中 标明 。 

(1) SUB Ri ,Rs 指令 完成 R; 一 (R;) 一 (Ri) 的 操作 ，; 

(2) LDA (R;),R。 指令 完成 将 (R,) 为 地 址 的 主 存 单元 的 内 容 取 至 寄存 各 R。 中 , 男 出 
其 指令 周期 流程 图 ,并 列 出 相应 的 微 操 作 控制 信号 (假定 指令 地 址 已 送信 PC) 。 


AA 忆 线 


图 7-50” 双 总 线 结构 CPU 的 多 


据 通路 


J 运算 天 结构 如 图 7-51 所 示 , Ri，,R。 ; 人, 是 三 个 寄存 斯,A 和 B 是 两 个 三 选 一 的 多 路 
开关 ,通路 的 选择 由 AS。、AS: 和 BSo、BSi 端 控制 ,例如 BSoBsS 二 11 时 ,选择 Rs ,BSo BS 一 
01 时 ,选择 Ri……*ALU 是 算术 /逻辑 单元 ,SS; 为 它 的 两 个 操作 控制 端 ,其 功能 如 下 : 


证 
212 


一 01 时 ,ALU 输出 


SiS 一 11 时 ,ALU 输出 
请 设计 控制 运算 需 通 路 的 微 指令 格式 。 


A 
— A+B 
~ A—B 
~AMB 


10. 已 知 攻 机 米 用 币 程 友 控 制 方式 ,其 控制 存储 帮 容 量 为 512X48( 位 ), 微 程 厅 在 整个 
控制 存储 器 中 实现 转移 ,可 控制 的 条 件 共 4 个 , 微 指令 采用 水 平 型 格 式 , 后 继 微 指令 地 址 采 


用 上 断定 方式 ,如 图 7-52 所 示 。 
(1) 微 指令 中 的 三 个 字段 分 别 对 应 多 少 位 ? 


(2) 画 出 对 应 这 种 微 指令 格式 的 微 程 序 控制 茶 逻 辑 框图 。 
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MV 


图 7-51 运算 器 结构 


微 命 令 判别 测试 “| ”下 地 址 字段 


操作 控制 字段 顺序 控制 字段 
图 7-52 微 指 令 格 式 
11. 假设 某 计 算 机 的 运算 器 框图 如 图 7-53 所 示 , 其 中 ALU 为 16 位 的 加 法 器 (高 电 平 


工作 ) ,SA .SB 为 16 位 锁 存 右 ,4 个 通用 寄存 顺 由 了 触发 磊 组 成 ,Q 端 输 出 ,其 读 写 控制 如 
下 表 所 示 。 


Em 


-= 


与 控制 


三 


要 求 : (1) 设计 微 指 令 格 式 ; 
(2) 男 出 ADD,SUB 两 条 微 指 令 程 序 流程 图 (不 编码 ) 。 
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LDsa 
“RA 上 读 选择 


4 个 通用 寄存 格 


图 7-53 ”运算 器 框图 


12. 已 知 MOV、ADD、COM.、ADT 4 条 指令 微 程 序 流 如 图 7-54 所 示 , 已 知 P(1) 的 条 件 
是 指令 寄存 器 OP 字段 ,P(2) 的 条 件 码 是 进位 寄存 器 CJ, 请 设计 画 出 微 程序 控制 器 地 址 转 


移 浊 和 辑 图 。 


0000 
M 一 民 


MOYV ADD | COM ADT 


1000 1001 1010 1011 


UUUU ”UUUU 2 UUUU | 1 1 
R, 十 民 -i R, 


到 7-54 4 条 指令 框图 
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由 于 器 件 本 身 的 限制 ,任何 单 处 理 机 的 速度 最 高 不 能 超过 某 个 上 限 值 。 要 突破 这 个 界 
限 , 灯 用 多 处 理 机 或 多 计算 机 的 并 行 体系 结构 是 行 之 有 效 的 途径 。 现 代 计 算 机 的 设计 者 ,无 
论 是 在 CPU 内 部 还 是 在 计算 机 体系 结构 上 , 越 来 越 多 地 采用 并 行 处 理 技 术 和 并 行 体系 

本 草 首 先 介 绍 计 算 机 系统 的 并 行 性 概念 ,对 计算 机 中 使 用 的 时 间 重 党 、 资 源 重复 和 资源 
-部 等 提高 放 ~ 途径 进行 概括 性 的 介绍 ; 然后 分 别 介 绍 现代 计算 机 首 遍 采用 的 流 
上 线 技术 和 多 处 理 机 技术 等 并 行 处 理 技术 ; 最 后 对 近 几 年 发 展 起 来 且 应 用 非 第 广泛 的 机 群 
系统 、 多 核 处 理 器 进行 讨论 。 


8.1 计算 机 系统 的 并 行 性 


现代 计算 机 系统 是 由 硬件 和 软件 组 成 的 复杂 系统 。 当 设计 一 种 新 型 计算 机 系统 时 , 利 
完 面临 的 问题 是 什么 呢 ? 接 下 来 会 列 出 很 多 问题 ,如 机 右 指 令 系 统 的 设计 、 功 能 组 织 、 人 逻辑 
设计 实现 拉 术 和 等。 实现 拉 术 又 包括 集成 电路 设计 、 制 千 和 封 竣 技术 、 系 统制 造 和 组 站 技 术 、 
供电 ,冷却 拉 术 等 ,而 最 重要 的 古 确定 计算 机 的 体系 结构 。 本 方 自 先 介 绍 计 算 机 系统 结构 的 
概念 及 分 类 ,然后 介绍 提高 机 带 性 能 所 米 用 的 时 间 并 行 和 空间 并 行 的 技术 途径 。 


8.1.1 计算 机 体系 结构 的 概念 


“计算 机 体系 结构 ”这 个 名 词 来 源 于 英文 Computer Architecture, 也 有 详 成 “计算 机 系 
统 结构 ”的 。Architecture 这 个 词 原来 用 于 建筑 领域 ,其 音义 是 “建筑 学 “建筑 物 的 设计 或 
式样 ”, 它 是 指 一 个 系统 的 外 貌 。20 世纪 60 年 代 这 个 词 被 引入 计 算 机 领域 ,“ 计 算 机 体系 结 
构 ? 一 词 已 经 得 到 普遍 应 用 , 它 研 究 的 内 容 不 但 涉及 计算 机 硬件 ,也 涉及 计算 机 软件 ,已 成 为 
一 门 掌 科 。 但 对 “计算 机 体系 结构 ”一 词 的 含义 仍 有 多 种 说 法 ,并 无 统一 的 定义 。 

经 典 的 “计算 机 体系 结构 ?定义 是 C. M. Amdahl 等 人 在 1964 年 设计 IBM 360 系统 时 提 
出 的 。 他 们 把 计算 机 体系 结构 定义 为 程序 员 所 看 到 的 一 个 计算 机 系统 的 概念 性 结构 和 功能 
特性 。 这 实际 上 是 计算 机 系统 的 外 特性 。 

按照 计算 机 层次 结构 ,不 同 程序 设计 者 所 看 到 的 计算 机 有 不 同 的 属性 。 例 如 ,对 于 使 用 
高 级 语言 的 程序 员 来 讲 , 一 台 IBM 3090 大 型 机 、 一 台 VAX-11/780 小 型 机 或 一 台 PC 微型 
机 ,看 起 来 部 是 一 样 的 ,因为 在 这 三 台 计 算 机 上 运行 他 所 编制 的 程序 ,所 得 到 的 结果 是 一 样 
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的 。 但 对 于 使 用 汇编 语言 程序 的 程序 员 来 讲 , 由 于 这 三 台 机 顺 的 汇编 语言 指令 完全 不 一 样 ， 
他 所 面 对 的 计算 机 的 属性 就 也 会 不 一 样 。 另 外 ,即使 对 同一 台 机 器 来 讲 , 处 在 不 同 级 别 的 程 
序 员 ,例如 应 用 程序 员 ,高 级 语言 程序 员 、 系 统 程序 员 和 汇编 程序 员 ,他 们 所 看 到 的 计算 机 外 
特性 也 是 完全 不 一 样 的 。 那 么 通 筑 所 讲 的 计算 机 体系 结构 的 外 特性 应 是 处 在 哪 一 级 的 程序 
员 所 看 到 的 外 特性 呢 ? 比较 一 致 的 看 法 是 机 咒语 言 程序 员 或 编译 程序 编写 者 所 看 到 的 外 特 
性 ,这 种 外 特性 是 指 由 他 们 所 看 到 的 计算 机 基本 属性 , 即 计算 机 的 概念 性 结构 和 功能 特性 ， 
这 是 机 器 语言 程序 员 或 编译 程序 编写 者 为 使 其 所 编写 、 设 计 或 生成 的 程序 能 在 机 器 上 正确 
运行 所 必须 休 循 的 。 由 机 莫 语 言 程序 员 或 编译 程序 编写 者 了 所 看 到 的 计算 机 的 基本 属性 是 指 
传统 机 带 级 的 体系 结构 ,在 传统 机 器 级 之 上 的 功能 被 视 为 属于 软件 功能 ,而 在 其 之 下 的 则 属 
于 硬件 和 固件 功能 。 因 此 ,计算 机 系统 的 概念 性 结构 和 功能 属性 实际 上 是 计算 机 系统 中 软 
便 件 之 间 的 界面 。 

在 计算 机 技术 中 ,一 种 本 来 存在 的 事物 或 属性 ,但 从 某 种 角度 看 似乎 不 存在 , 称 为 透明 
性 现象 。 通 常 ,在 一 个 计算 机 系统 中 ,低层 机 器 级 的 概念 性 结构 和 功能 特性 ,对 高 级 语言 程 
序 员 来 说 是 透明 的 。 由 此 看 出 ,在 层次 结构 的 各 个 级 上 都 有 它 的 体系 结构 。 

就 目前 的 通用 机 来 说 ,计算 机 体系 结构 的 属性 应 包括 以 下 几 个 方面 : 

(1) 机 病 的 数据 表示 , 即 机 珊 便 件 能 和 直接 识别 和 处 理 的 数据 类 型 。 

(2) 寄存 髓 组 ,包括 各 种 寄存 器 的 定义 .数量 和 使 用 方式 等 。 

(3) 指令 系统 ,包括 机 器 提 供 的 各 种 指令 集 及 寻 址 方式 等 。 

) 数据 通路 ,机 带 不 同 部 件 进 行 效 据 传输 的 通路 。 

(5) 中 上 断 系 统 , 包 括 中 断 的 类 型 和 中 断 的 处 理 方法 等 。 

(6) 机 器 状态 ,如 管 态 . 目 态 及 各 种 状态 之 间 的 切换 等 。 

(7) 存储 系统 , 主 存 容量 ,程序 员 可 用 的 最 大 存储 空间 和 存储 保护 等 。 

(8) 输入 输出 ,输入 输出 的 连接 方式 、. 输 入 输出 的 传输 控制 方式 等 。 

现代 计算 机 体系 结构 的 概念 ,除了 包括 经 典 的 计算 机 体系 结构 的 概念 范 蚂 
构 ) ,还 包括 计算 机 组 成 和 计算 机 实现 的 内 容 。 

计算 机 组 成 CComputer Organization) 所 研究 的 是 计算 机 系统 的 逻辑 实现 ,而 计算 机 实 
现 (Computer Implementation) 所 人 研究 的 是 计算 机 系统 的 物理 实现 。 计 算 机 体系 结构 、 计 
算 机 组 织 .计算 机 实现 三 者 互 不 相同 但 又 互相 影响 。 相 同体 系 结 构 的 计算 机 可 以 因为 速 
度 不 同 而 采用 不 同 的 组 织 结构 (如 系列 机 ); 同样 ,一 种 组 织 结 构 可 有 多 种 不 同 的 实现 

随 着 计算 机 体系 结构 的 发 展 , 出 现 了 各 种 复杂 程度 、 
系统 ,同时 也 出 现 了 对 计算 机 系统 进行 分 类 的 不 同方 法 。 

1966 年 ,Flynn 提出 了 按 指 令 流 和 数据 流 的 多 倍 性 对 计算 机 体系 结构 进行 分 类 的 方法 。 
Flynn 分 类 法 是 基于 指令 流 和 数据 流 这 两 个 概念 的 ,指令 流 是 机 上 需 执 行 的 指令 序列 ,数据 流 
是 由 指令 流 调 用 的 数据 序列 ,包括 输入 数据 和 中 间 结 果 。 而 多 倍 性 是 指 在 系统 受 限 制 的 部 
件 上 ,同时 处 于 同一 执行 阶段 的 指令 或 数据 的 最 大 数目 。 从 某 种 程度 上 说 ,指令 流 和 数据 流 
是 相互 独立 的 ,因此 有 单 指令 流 单数 据 流 (SISD)、 单 指令 流 多 数据 流 (SIMD) ,多 指令 流 单 
数据 流 (MISD) 和 多 指令 流 多 数据 流 (MIMD)4 种 类 型 。 


(指令 集结 


ns 


运行 速度 .处 理 能 力 各 异 的 计算 机 
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1. SISD 体系 结构 


符合 SISD 体系 结构 的 计算 机 代表 了 传统 的 汉 “. 诺 依 曼 机 器 , 即 大 多 数 单机 系统 。 处 
理 器 品行 执行 指令 ,或 者 处 理 器 内 部 采用 指令 流水 线 ,以 时 间 重 又 技术 实现 了 一 定 程度 上 的 
指令 并 行 执行 。 但 其 都 是 以 单一 的 指令 流 从 存储 器 取 指 令 , 以 单一 的 数据 流 从 存储 器 取 操 
作 数 和 将 结果 写 回 存储 器 。 


2. SIMD 体系 结构 


SIMD 体系 结构 有 单一 的 控制 部 件 , 但 是 有 多 个 处 理 部 件 。 计 算 机 以 一 个 控制 单元 从 
存储 弟 取 单一 的 指令 流 , 一 条 指令 同时 作用 到 各 个 处 理 单元 ,控制 各 个 处 理 单 元 对 来 自 不 同 
数据 流 的 数据 组 进行 操作 。 这 种 体系 结构 的 典型 代表 是 阵列 处 理 机 。 


3. MISD 体系 结构 


在 MISD 体系 结构 中 ,有 几 个 处 理 部 件 ,各 配 有 相应 的 控制 部 件 。 各 个 处 理 部 件 接收 不 
同 的 指令 ,多 条 指令 同时 在 一 份 数据 上 进行 操作 。 大 多 数 人 认为 能 列 在 这 一 系统 中 的 计算 
机 很 少 或 根本 不 存在 。 


4. MIMD 体系 结构 


在 MIMD 体系 结构 中 ,同时 有 多 个 处 理 部 件 , 并 且 每 个 处 理 部 件 都 配 有 相应 的 控制 部 
件 。 各 个 处 理 部 件 可 以 接收 不 同 的 指令 并 对 不 同 的 数据 流 进行 操作 。 大 多 数 现代 的 并 行 计 
算 机 都 属于 这 一 类 ,多 处 理 机 系统 和 多 计算 机 系统 都 是 MIMD 型 的 计算 机 ， 


8.1.2 体系 结构 中 的 并 行 性 


饶 究 计算 机 体系 结构 的 目的 是 提高 计算 机 系统 的 性 能 ,开发 计算 机 系统 的 并 行 性 是 计 
算 机 体系 结构 的 重要 研究 内 容 之 一 。 现 代 计 算 机 的 一 个 共同 特点 是 大 量 采 用 并 行 技术 ,使 
计算 机 的 性 能 得 以 不 断 提 高 。 

并 行 性 (parallelism) 指 的 是 在 同一 时 刻 或 是 同一 时 间 间 隅 内 完成 两 种 或 两 种 以 上 性 质 
相同 或 不 相同 的 工作 。 也 就 是 说 只 要 时 间 上 互相 重 闭 ,就 存在 并 行 性 。 这 里 ,并 行 性 包含 同 
时 性 和 并 发 性 两 层 含 义 。 其 中 同时 性 (simultaneity) 指 两 个 或 多 个 事件 在 同一 时 刻 发 生 的 
并 行 性 ; 并 发 性 (concurrency) 指 两 个 或 多 个 事件 在 同一 时 间 间 隅 内 发 生 的 并 行 性 。 

x86 微 处 理 需 的 发 展 就 是 并 行 技术 发 展 的 一 个 很 好 的 体现 : 多 流水 线 、 超 标量 设计 等 
痢 是 提高 CPU 的 并 行 处 理 能 力 的 关键 。 而 在 机 群 的 体系 结构 中 ,更 是 充分 利用 了 并 行 性 
这 一 特点 。 人 们 创建 和 使 用 并 行 计 算 机 主要 是 为 了 解决 单 处 理 融 的 速度 瓶颈 ,利用 并 行 拉 
术 来 提高 应 用 性 能 。 

计算 机 系统 中 的 并 行 性 有 不 同 的 等 级 。 不 同 的 分 类 标准 ,分 类 的 结果 也 不 相同 

从 执行 程序 的 角度 看 ,并行 性 等 级 从 低 到 高 可 分 为 

(1) 指令 内 部 并 行 : 指 的 是 指令 内 部 的 微 操 作 之 间 的 并 行 。 

(2) 指令 级 并 行 : 指 的 是 并 行 执 行 两 条 或 多 条 指令 ,就 是 指令 之 间 的 并 行 。 

(3) 线程 级 并 行 : 指 的 是 并 发 执行 多 个 线程 ,通常 是 以 一 个 进程 内 控制 派生 的 多 个 线 
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程 为 调度 单位 的 。 

(4) 任务 级 或 过 程 级 并 行 : 指 的 是 并 行 执行 两 个 或 多 个 过 程 或 任务 (程序 段 ) 。 

(5) 作业 或 程序 级 并 行 : 指 的 是 在 多 个 作业 或 程序 间 的 并 行 。 

不 同 级 的 并 行 性 在 不 同 的 机 器 系统 中 的 实现 方式 不 同 。 在 单 处 理 机 系统 中 ,这 种 并 行 
性 升 到 某 一 级 别 后 (如 任务 .作业 级 并 行 ), 则 要 通过 软件 (如 操作 系统 中 的 进程 管理 .作业 调 
度 等 ) 来 实现 。 而 在 多 处 理 机 系统 中 ,由 于 已 有 了 完成 各 个 任务 或 作业 的 处 理 机 ,其 并 行 性 
则 是 由 硬件 来 实现 的 。 

从 处 理 数 据 的 角度 ,并行 性 等 级 从 低 到 高 可 以 分 为 

(1) 字 串 位 串 : 指 的 是 同时 只 对 一 个 字 的 一 位 进行 处 理 。 

(2) 字 串 位 并 : 指 的 是 同时 对 一 个 字 的 全 部 位 进行 处 理 , 不 同 字 之 间 是 串 行 的 。 

(3) 字 并 位 串 : 指 的 是 同时 对 许多 字 的 同一 位 ( 称 位 片 ) 进 行 处 理 。 

(4) 全 并 行 : 指 的 是 同时 对 许多 字 的 全 部 或 部 分 位 进行 处 理 。 

在 一 个 计算 机 系统 中 ,可 以 采取 多 种 并 行 性 措施 , 既 可 以 有 执行 : 
可 以 有 处 理 数据 方面 的 并 行 性 。 


8.1.3 提高 并 行 性 的 技术 途径 
1. 三 种 基本 并 行 拉 术 


提高 并 行 性 的 技术 途径 主要 有 时 间 重 茯 、 资 源 重 4 
1) 时 间 重 登 
时 间 重 蕉 指 的 是 多 个 处 理 过 程 在 时 间 上 相互 错开 ,轮流 重 蕉 地 使 用 同一 大便 件 设备 的 
各 个 部 分 ,以 加 快 便 件 周转 而 腊 得 速度 。 

实现 时 间 重 登 的 基础 就 是 部 件 功能 专用 化 。 实 质 承 是 把 一 件 工作 按 功 能 分 割 为 右 干 个 
相互 联系 的 部 分 ; 然后 把 每 一 部 分 指定 给 专门 的 部 件 完 成 ; 最 后 按时 间 重 车 原 则 把 各 部 分 
执行 过 程 在 时 间 上 重 著 起 来 ,使 所 有 部 件 依 次 分 工 完成 一 组 同样 的 工作 。 流 水 线 搁 术 就 是 
时 间 重 车 的 典型 应 用 ，。 

例如 ,一 条 指令 的 执行 可 以 看 成 由 4 个 过 程 组 成 , 即 取 指令 ,指令 幸 公 ,指令 执行 和 写 结 
条, 如 图 8-1(a) 所 示 。 


和 资源 共享 三 种 。 


| 2 3 4 5 7 时 间 /Ar 
(b) 4 条 指令 流水 的 时 空 图 
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将 这 4 个 过 程 分 别 使 用 4 个 专用 的 部 件 实现 , 即 取 指令 部 件 (IF)、 指 令 译 码 部 件 (ID)、 
指令 执行 部 件 (EX) 和 写 结果 部 件 (WB)。 多 条 指令 在 时 间 上 相互 错开 ,来 用 如 图 8-1(b) 所 
示 的 方式 工作 ,轮流 重 琶 地 使 用 同一 个 部 件 , 加 快 指令 周转 来 赢得 速度 。 本 例 中 ,每 个 子 过 
程 需 At 完成 ,4 条 指令 如 果 顺 序 串 行 执行 需 4X4At 一 16At, 而 采用 时 间 重 芋 技 术 后 4 条 指 
今日 需 7At。 

时 间 重 车 , 因 无 须 重复 设置 便 件 ,设备 利用 充分 ,因此 是 单机 系统 中 并 行 性 发 展 的 重要 
手段 。 在 发 展 高 性 能 单 处 理 机 的 过 程 中 ,起 着 主导 作用 的 也 是 时 间 重 闭 这 个 途径 。 

2) 资源 重复 

资源 重复 指 的 是 根据 "以 数量 取胜 ?的 原则 来 实现 并 行 ,其 付出 的 代价 是 在 空间 上 通过 
重复 地 设置 资源 ,尤其 是 硬件 资源 ,以 提高 计算 机 系统 的 性 能 。 

例如 ,图 8-2 中 ,设置 了 nn 个 相同 的 人 处理 单元 PE 、 PE, … 、PE, ,在 同一 个 控制 单元 
(CU) 的 控制 下 ,给 各 处 理 单元 分 配 不 同 的 数据 完成 同一 种 运算 或 操作 ,以 提高 处 理 
速度 。 


控制 单元 (CU) 


处 理 单 元 PE: 处 理 单 元 PE:| … | 处 理 单 元 PE， 


图 8-2 资源 重复 的 并 行 


资源 重复 也 是 计算 机 系统 中 经 常 采 用 的 并 行 技术 ,通过 使 用 各 种 资源 重复 技术 ,如 部 件 
宛 余 .多 操作 部 件 、 多 存储 体 .并 行 处 理 机 、 相 联 处 理 机 、 多 处 理 机 系统 等 ,可 以 有 效 提高 计算 
机 系统 性 能 。 

3) 资源 共享 

帝 源 共 圣 是 一 种 软件 方法 的 并 行 ,人 它 使 多 个 任务 按 一 定 的 时 间 顺 序 软 流 使 用 同一 私人 鲁 
件 设备 。 资 源 共 至 的 实质 就 是 用 单 处 理 机 模拟 多 处 理 机 的 功能 ,形成 所 谓 虚 拟 机 的 概念 , 体 
现在 : 多 起 程序 .分 时 系统 、 多 终端、 远程 终端 、 久 能 终端 、 分 布 处 理 系统 (把 奋 干 个 具有 独立 
功能 的 处 理 机 或 计算机 相互 连接 起 来 ,在 操作 系统 的 全 盘 控 制 下 ,统一 协调 地 工作 ,而 最 少 
依 顿 集中 的 程序 .数据 或 硬件 ) 等 方面 的 应 用 上 。 


2. 多 机 系统 的 并 行 性 


多 机 系统 包括 多 人 处理 机 系统 和 多 计算 机 系统 
资源 共享 这 三 种 基本 的 技术 途径 , 癌 着 三 种 不 同 的 多 人 处 班 
施 上 与 单机 系统 有 所 不 同 。 

通常 用 耦合 度 来 反映 多 机 系统 的 各 机 器 之 间 的 物理 连接 的 紧密 程度 和 交互 作用 能 力 的 
吗 弱 。 多 机 系统 的 耦合 度 分 为 最 低 耦 合 .松散 耦合 、 紧密 耦合 等 几 类 。 

1) 最 低 耦 合 

耦合 度 最 低 的 系统 。 除 通过 某 种 中 间 存 储 介 质 之 外 ,各 计算 机 之 间 没 有 物理 连接 ,也 无 
共享 的 连 机 硬件 资源 。 


。 多 机 系统 也 悍 循 时 间 重 车、 资源 重复 和 
机 方 回 发 展 。 但 在 采取 的 技术 指 
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2) 松散 耦合 或 间接 耦合 系统 

公 耦 合 系统 的 各 处 理 机 间 通 过 共享 IO 子 系统 .通道 或 通信 线路 实现 处 理 机 间 的 通信 
和 互 连 , 不 共享 主 存 , 但 可 共享 某 些 外 围 设备 (如 磁盘 ,磁带 等 ), 机 间 的 相互 作用 是 在 文件 或 
数据 集 一 级 进行 的 。 松 散 耦 合 多 处 理 机 由 多 个 处 理 机 一 个 通道 .一 个 仲裁 开关 和 消息 传送 
系统 组 成 。 每 个 处 理 机 带 有 一 个 局 部 存储 器 和 一 组 1/O 设备 。 在 仲裁 开关 的 通道 中 有 高 
速 通信 存储 ,用 来 缓冲 传送 的 信息 块 。 

3) 紧密 灯 合 系统 或 且 接 粳 合 系统 

紧 耦 合 多 处 理 机 系统 ,其 处 理 机 间 物 理 连 接 的 频带 较 高 ,它们 往往 通过 总 线 或 高 速 开 关 
实现 互 连 , 可 以 共享 主 存 , 各 处 理 机 之 间 是 通过 互联 网 络 共享 主 存 的 。 一 般 地 , 紧 耦 合 系统 
由 PP 台 处 理 机 、m 个 存储 器 模块 .& 个 IO 通道 和 三 个 互联 网 络 构成 。 其 中 ,处 理 机 -存储 器 
网 络 实现 处 理 机 与 各 存储 模块 的 连接 ; 处 理 机 中 断 信 号 网 络 实现 多 处 理 机 之 间 的 互 连 ; 处 
理 机 -I/O 互联 网 络 实现 处 理 机 与 外 设 的 连接 。 每 个 处 理 机 可 上 自 市 局 部 存储 顺 , 也 可 上 自 市 
cache 存储 天 模块 ,可 采用 流水 工作 方式 。 紧 耦合 系统 多 用 于 并 行人 作业 中 的 多 任务 ,一般 处 
理 机 是 同 构 的 。 


5.2 流水线 技术 


计算 机 中 的 流水 线 技 术 来 源 于 工业 领域 的 流水 线 生 产 , 属 于 并 行 处 理 技 术 中 的 一 种 时 
间 重 登 。 流 水 线 技 术 最 早 在 大 型 计算 机 系统 中 来 用 ,而 现代 计算 机 无 论 是 小 型 还 是 微型 计 
算 机 均 在 CPU 中 大 量 使 用 了 该 技术 ,以 提高 CPU 执行 指令 的 速度 。 


8.2.1 流水 线 的 基本 概念 


在 4.3 节 曾 经 提 到 了 流水 线 技术 。 每 当 提 起 流水 线 技术 ,人 们 就 容易 将 其 与 工业 生产 
中 的 产品 生产 流水 线 联系 起 来 。 的 确 , 计 算 机 中 的 流水 线 概 念 正 是 由 此 得 来 的 。 为 了 对 计 
算 机 中 的 流水 线 概念 有 更 深入 的 认识 ,首先 来 看 看 产品 生产 流水 线 的 情况 。 

假设 在 某 工 厂 车 间 , 生 产 某 个 产品 需要 4 道 工 序 ,该 产品 生产 车 间 以 前 只 有 一 个 工人 ， 
一 套 生 产 该 产品 的 设备 。 该 工人 每 天 工作 8 小 时 ,每 4 分 钟 可 以 生产 该 产品 1 件 , 这 样 一 天 
可 以 生产 该 产品 120 件 。 现 在 工厂 希望 将 该 产品 的 日 产量 提高 到 480 件 , 那 么 采取 什么 办 
法 才能 实现 这 一 目标 呢 ? 一 种 很 容易 想到 的 办 法 就 是 增加 3 个 工人 和 3 大 设备 , 米 用 传统 
的 生产 方式 , 即 每 个 工人 单独 使 用 一 套 设备 进行 生产 ,每 个 工人 日 产量 是 120 件 ,4 个 工人 
就 是 480 件 。 这 种 方法 当然 是 可 行 的 ,但 其 付出 的 代价 是 增加 了 3 套 设 备 。 男 一 种 办 法 就 
是 只 增加 3 个 工人 ,不 增加 设备 。 同 时 对 设备 的 生产 流程 进行 改造 : 将 4 追 工序 分 离开 来 ， 
使 得 每 道 工 序 的 生产 时 间 一 样 ( 均 为 1 分 钟 ) ,每 个 工人 专 做 一 道 工 序 ,每 完成 一 道 工 序 就 将 
半成品 交 给 下 一 道 工 序 的 工人 ,直至 生产 出 完整 的 产品 ,如 图 8-3 所 示 。 经 过 这 种 改造 以 
后 ,每 隔 1 分 钟 就 有 1 件 产 品 生产 出 来 ,这 样 的 话 , 一 天 8 小 时 就 同样 可 以 生产 480 件 该 产 
品 了 。 后 一 种 方法 与 前 一 种 方法 相 比 , 节 省 了 3 套 设 备 , 而 实现 的 效果 是 相同 的 ,具有 更 好 
的 “性 能 价格 比 ”。 

在 早期 的 计算 机 系统 中 ,无 论 是 指令 的 执行 还 是 数据 的 处 理 , 都 是 严格 地 按照 串 行 的 方 
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式 来 进行 的 ,也 就 是 指令 或 数据 流入 某 个 部 件 后 ,无 论 需要 执行 或 处 理 的 时 间 是 长 还 是 短 ， 
这 时 除了 正在 执行 或 处 理 的 部 件 以 外 ,其 余 的 部 件 都 处 于 闲置 状态 。 这 样 的 处 理 方式 控制 
简单 ,但 效率 低下 ,因为 这 些 闲 置 的 部 件 完全 可 以 在 等 待 的 时 间 里 完成 一 定 的 工作 。 

将 工业 生产 中 的 流水 线 思想 引入 计算 机 中 。 例 如 ,可 以 将 计算 机 中 的 指令 部 件 划 分 成 
两 个 子 部 件 : 取 指 令 部 件 和 执行 部 件 。 取 指令 部 件 专门 负责 从 存储 顺 中 取 指 令 ; 而 执行 部 
件 专 门 负责 完成 指令 的 译 码 和 执行 等 操作 。 现 假设 这 两 个 部 件 完 成 一 次 操作 所 需 时 间 均 为 
Al , 按 传统 的 串 行 方式 工作 的 话 ,该 指令 部 件 完 成 一 条 指令 从 取 指 到 执行 的 时 间 为 2At; 而 
采用 流水 线 工 作 方式 的 话 , 则 每 隔 Az 的 时 间 就 可 以 完成 一 条 指令 的 执行 。 显然 ,指令 执行 
速度 提高 了 一 售 。 再 如 ,对 于 浮 点 加 法 器 而 言 , 可 以 把 浮 点 加 法 的 全 过 程 分 解 为 求 阶 差 、 对 
阶 、 尾 数 加 和 规格 化 4 个子 过 程 ,让 每 个 子 过 程 都 在 各 自 独 立 的 部 件 上 完成 。 同 样 假 设 这 4 
个 部 件 每 个 完成 一 次 操作 的 时 间 均 为 At, 按 传统 的 串 行 方式 工作 的 话 ,该 浮 点 加 法 部 件 完 
成 一 次 浮 点 加 的 时 间 为 4At; 而 采用 流水 线 工 作 方 式 的 话 , 则 每 隔 Az 的 时 间 就 可 以 完成 一 
次 浮 点 加 。 显 然 , 一 次 浮 点 加 的 速度 提高 了 3 倍 。 

实际 上 ,计算 机 中 的 流水 线 技术 是 一 种 利用 时 间 重 钱 技 术 提 高 机 带 性 能 的 并 行 处 理 技术 ， 
它 能 在 不 增加 机 器 硬 部 件 的 情况 下 ,通过 对 某 一 部 件 功能 进行 合理 的 分 解 与 设计 ,有 效 提 高 部 
件 的 处 理 速 度 。 目 前 流水 线 技术 大 量 应 用 在 CPU 内 部 ,包括 组 成 CPU 各 部 件 之 间 的 流水 和 
部 件 内 部 的 流水 等 。 流 水 线 技术 的 应 用 对 于 提高 处 理 机 的 性 能 起 到 了 相当 大 的 作用 。 


流水 线 可 以 从 不 同 的 角度 进行 分 类 ,一般 来 讲 流 水 线 可 以 分 为 以 下 几 种 类 型 。 


按照 计算 机 处 理 的 级 别 来 分 类 ,流水 线 可 以 分 为 部 件 级 流水 线 .指令 级 流水 线 和 处 理 机 

部 件 级 流水 指 的 是 构成 部 件 内 的 各 个 子 部件 间 的 流水 ,如 运算 着 内 译 点 加 、 减 运算 的 流 
水 。 指 令 级 流水 指 的 是 构成 计算 机 系统 的 多 个 处 理 机 之 间 的 流水 ,又 称 为 安 流 水 。 处 理 机 
级 流水 指 的 是 构成 处 理 机 的 各 部 件 之 间 的 流水 ,如 一 条 指令 分 成 “ 取 指 ”“ 分 析 ”“ 执 行 ” 后 ， 
这 三 者 之 间 的 流水 。 


2. 里 功能 流水 线 和 多 功能 流水 线 


按照 流水 线 可 以 完成 的 动作 数量 来 分 类 ,又 可 以 分 为 单 功能 流水 线 和 多 功能 流水 线 。 
单 功能 流水 线 指 的 是 只 能 实现 单一 功能 的 流水 ,如 只 能 实现 浮 点 加 减 而 不 能 实现 浮 点 乘除 
的 流水 线 。 当 然 , 如 果 要 完成 多 种 功能 的 流水 可 以 将 多 个 单 功能 的 流水 线 组 合 起 来 实现 . 
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多 功能 流水 线 指 的 是 在 同一 流水 线 的 各 个 段 之 间 可 以 用 多 种 不 同 的 连接 方式 以 实现 多 种 不 
同 的 功能 或 运算 。 

如 图 8-4 所 示 的 就 是 同一 个 流水 线 在 不 同 连接 下 可 以 分 别 实 现 泽 点 加 、 减 运算 时 的 连 
接 和 定点 乘 .除法 运算 时 的 连接 。 


ee 本 
| 
, i 


(a) 流水 线 的 八 个 功能 段 (b) 浮 扣 加 、 减 运 (c) 浮 点 乘 、 除 运 
外 时 的 庆 水 连接 异 时 的 流水 连接 


图 8-4 ”多 功能 流水 线 的 实现 


3. 静态 流水 线 和 


动态 流水 线 


按照 流水 线 的 各 个 段 是 否 允 许 同时 进行 多 种 不 同 功能 的 连接 流水 ,可 以 把 流水 又 分 成 
静态 流水 线 和 动态 流水 线 。 

静态 流水 线 指 的 是 在 某 一 段 时 间 内 各 功能 段 只 能 按照 一 种 功能 连接 形成 流水 线 , 只 能 
等 竺 该 流水 线 上 全 部 任务 流 空 后 ,才能 切换 成 另 一 种 功能 连接 进行 流水 。 显 然 , 这 种 流水 操 
作 ,实现 起 来 很 简单 ,所 需 的 控制 方式 也 不 复 洒 。 但 就 指令 级 的 流水 而 言 , 如 果 进 入 的 是 一 
串 相 同 的 运算 指令 ,静态 流水 性 能 还 不 销 ; 但 如 果 进 入 的 是 浮 点 加 、 定 点 乘 , 浮 点 加 、 定 点 
乘 、……… 这 样 一连 串 功能 相 异 的 指令 时 ,静态 流水 线 的 性 能 就 降低 得 还 不 如 指令 顺序 执行 方 
式 。 而 动态 流水 线 是 指 在 同一 时 间 内 , 当 某 些 段 正 在 实现 某 种 运算 时 , 另 一 些 段 却 可 以 实现 
另 一 种 运算 。 这 样 ,就 不 是 非得 相同 运算 的 指令 才能 进入 流水 处 理 。 显 然 , 这 对 提高 流水 线 
的 效率 很 有 好 处 。 然 而 ,这 却 会 使 流水 线 的 控制 变 得 很 复杂 。 

例如 ,假设 先后 有 两 批 任 务 要 完成 ,第 一 批 是 交 个 任务 的 溯 点 加 、 减 运算 ; 第 二 批 任务 
是 A~E 共 5 个 任务 的 定点 乘法 运算 ,分 别 按 照 静 态 、 动 态 两 种 不 同 的 方式 形成 流水 线 , 其 
流水 线 时 空 图 如 图 8-5 所 未 。 

从 软 人 硬件 功能 分 配 的 观点 上 看 ,静态 流水 线 是 功能 负担 较 多 地 加 在 软件 上 了 ,以 简化 硬 
件 控 制 ; 而 动态 流水 线 则 是 将 功能 更 多 地 由 硬件 来 实现 ,以 提高 流水 的 效能 。 目 前 大 多 数 
高 性 能 流水 计算 机 采用 多 功能 静态 流水 线 ,就 是 因为 其 控制 和 实现 都 比较 简单 。 
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4. 线性 流水 线 和 非 线性 流水 线 


如 采 按 照 流水 线 内 部 功能 部 件 的 连接 方式 (如 各 功能 段 之 间 是 否 有 反馈 
可 分 为 线性 流水 线 和 非 线性 流水 线 。 

流水 线 各 段 之 间 串 行 连 接 , 各 段 只 经 过 一 次 , 且 各 功能 段 之 间 没 有 反馈 回路 的 ,就 称 
为 线性 流水 线 。 反 之 ， 人 ee og 反馈 回路 ,并 且 往 往 使 得 
任务 流 经 流水 线 时 需 多 次 经 过 茶 个 段 或 越过 茶 些 段 的 ,就 称 为 非 线 性 流水 线 , 如 图 8-6 


所 示 ，。 


图 8-6” 非 线性 流水 线 举 例 


5. 标量 流水 线 和 回 量 流水 丝 


:分 类 ,还 可 以 分 为 标量 流水 线 和 向 量 流水 线 。 
不 来 分 类 ,此 时 一 般 也 


如 果 按照 机 器 可 处 理 的 对 象 
按照 机 器 可 处 理 的 对 象 来 分 类 实质 就 是 从 机 器 所 具有 的 数据 
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意味 看 针对 该 机 各 所 具有 的 这 些 数据 表示 会 获得 相应 的 刹 件 支持 。 所 以 标量 流水 机 意味 看 
该 机 前 没有 四 量 数据 表示 ,只 能 用 标量 循环 方式 来 处 理 癌 量 和 数组 。 回 量 流水 机 则 意味 春 
该 机 船 有 问 量 数据 表示 ,并且 人 硬件 上 有 相应 的 部 件 的 文 持 ,如 机 人 第 上 一 般 郡 会 设置 有 回 量 指 
令 和 回 量 运算 人 硬件 ,能 流水 地 处 理 同 量 和 数组 中 的 各 个 元 系 。 显 然 , 回 量 流水 机 是 同 量 数据 
表示 和 流水 技术 相 绪 合 的 产物 。 


8.2.3 流水 线 的 主要 性 能 参数 


衡量 一 种 流水 线 人 处理 方式 的 性 能 融 低 的 参数 主要 有 耕 吐 量 、 加 速 比 和 效率 。 
吞吐 量 (Throughput,Tp), 指 的 是 计算 机 中 的 流水 线 在 单位 时 间 内 能 流出 的 任务 数 或 
数 。 流 水 线 的 耕 吐 量 可 以 进一步 分 为 最 大 耕 吐 量 和 实际 硅 吐 量 。 它 们 主要 和 流水 有 段 
的 处 理 时 间 、 过 在 寄存器 的 延迟 时 间 有 关 ， 流水 段 的 处 理 时 间 越 长 ,缓存 寄存 器 的 延迟 时 
问 越 大 ,那么 ,这 条 流水 线 的 否 吐 量 就 越 小 。 因 为 ,在 线性 流水 线 中 ,最 大 否 吐 量 Tp wx 一 
1/AT=1/max(AT, ,AT se. ,AT,) ,其 中 ,m 是 流水 线 的 段 数 ,AT; 表示 的 是 第 i 有 段 的 执 
行 时 间 。 显 然 ,最 大 砧 吐 量 有 党 到 了 瓶颈 段 的 约束 ,这 里 , 瓶 锋 段 指 的 是 所 有 段 中 执行 时 间 最 
长 的 那个 段 。 为 了 提高 流水 线 的 最 大 厨 吐 量 , 承 要 找到 瓶颈 段 ,并 设法 消除 此 瓶 锋 。 
例如 , 某 流 水 线 有 4 个 段 ,其 中 2 号 段 由 于 需 用 时 3At, 所 以 2 号 段 是 瓶 仙 段 , 见 图 8-7(a); 
5 个 任务 流 经 该 流水 线 时 的 流水 效果 的 实际 情况 如 图 8-7(b) 所 示 , 显 然 流 水 速度 受到 了 2 
号 瓶 锋 的 限制 。 
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8-7 ”最 大 厨 吐 量 取决 于 瓶 锋 段 的 时 间 


消除 瓶颈 部 分 对 流水 线 吞 吐 量 的 影响 一 般 有 两 种 方法 : 

(1) 把 竹 癸 部 分 的 流水 线 分 拆 ,以 便 任 务 可 以 充分 流水 处 理 。 

流水 段 的 处 理 时 间 过 长 ,一 般 是 由 于 任务 堵塞 造成 的 ,而 任务 的 堵塞 会 导致 流水 线 不 能 
在 同一 个 时 钟 周 期 内 启动 另 一 个 操作 ,那么 ,可 以 将 流水 段 进行 划 分 ,在 各 小 流水 段 中 间 设 
置 缓存 寄存 融 , 缓 冲 上 一 个 流水 段 的 任务 ,使 流水 线 充 分 流水 。 例 如 , 某 流水 线 , 除 2 号 流水 
段 外 ,各 功能 段 处 理 时 间 都 是 心 ,假如 2 号 流水 段 的 处 理 时 间 为 3A1, 那 么 ,可 以 把 2 号 流水 段 
再 细 分 成 三 小 段 , 这 样 ,每 小 段 的 功能 相同 ,但 是 处 理 时 间 已 经 变 成 3At/3 二 At 了 ,如 网 8-8 
所 示 。 
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(2) 在 瓶颈 部 分 设置 多 条 相同 的 流水 段 ,并 行 处 理 。 

上 例 中 ,对 付 2 叶 流 水 段 的 处 理 时 间 过 长 ,还 有 另外 一 种 方法 , 那 就 是 把 瓶颈 流水 段 用 
多 个 相同 的 并 联 流水 段 代 蔡 ,在 前 面 设 一 个 分 派 单 匹 来 对 各 条 流水 段 的 任务 进行 分 派 。 仍 
然 假设 瓶颈 流水 段 的 处 理 时 间 是 3Az: ,那么 经 过 3 条 并 联 流水 段 的 同时 处 理 , 实 际 需 要 的 时 
间 只 是 At。 这 样 , 就 达到 了 缩短 流水 段 的 处 理 时 间 的 目的 ,但 这 种 方法 因为 要 三 段 相 同 的 
流水 段 并 联 ,设备 成 本 较 高 ,而 且 , 乱 要 解决 好 在 各 并 行 子 过 程 之 间 的 任务 分 配 和 同步 控制 


问题 , 比 瓶 贷 子 过 程 骨 细 分 的 控制 要 复 洒 得 多 ,如 图 8-9 所 未 。 
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8-9 ” 抠 须 于 过 程 并 联 


下 面 介 绍 流水 线 的 实际 效率 的 分 析 并 计算 。 

由 于 流水 线 在 开始 工作 时 存在 建立 时 间 ,在 结束 时 存在 排 空 时 间 ,加 上 各 种 原因 使 流水 
线 不 能 连续 流动 ,流水 会 出 现 断 断 续 续 的 现象 ,所 以 流水 线 的 实际 否 吐 量 Tp 总 比 最 大 否 吐 
量 Tpmx 要 小 。 图 8-10 是 一 条 有 4 个 段 的 静态 流水 线 , 假 说 每 段 所 需 时 间 为 At,n 个 任务 
部 进入 流水 线 所 需 的 时 间 工 ,二 nAt, 流 水 线 建 立 所 需 时 间 ( 就 是 一 个 任务 全 部 进入 流水 线 月 
需 时 间 ) 为 TT 二 mAt, 之 后 n 一 1 个 任务 流出 流水 线 需 时 间 T, 二 (mn 一 1)Azt, 则 nn 个 任务 完成 
人 > 部 从 流水 线 流 空 s 所 和 需 的 时 间 为 工 二 荆 十 Ts 二 mAt 十 (mn 一 1)At,n 个 任务 的 实际 吞吐 量 

~=n/(T 二 TT,)=n/ (mAti (nm 1)At)., 

na 仍然 见 图 8-10, 相 阳 AT 时 间 后 ,有 5 个 任务 (n 二 5)A、B、C、D\E 进入 了 流水 
线 , 这 5 个 任务 的 流水 中 ,T,= 二 nAt==5At, 区 二 mAt==4At,T,= 二 (nn 一 1)At==4At,T= 二 工 十 
Ts 二 mAt 十 (n 一 1)At 二 4At 十 (5 一 1)At 二 8At, 实 际 否 吐 量 Tp 王 5/(8Ar) 。 


流水 线 的 段 效 m=4 流水 线 建立 时 间 九 =mAi 
n 个 任务 全 部 进入 注水 线 需 时 间 : To=nAi n 一 1 个 任务 演出 流水 线 的 有 时间: =(n-DAi 
福 间 | 总 时 间 T=T+D=mAtt(n-1)At 
( 段 写 ) 


上 回国 加 这 AlB|clp|E 
3 3 AlB. 

2 | 1121314| AlBlclp|E 
‘ale |， | |， AslclplE 


4 nl 严 ntl: AT Ha] /A 


图 8-10 ”分析 实际 否 吐 量 的 时 空 图 


显然 ,如 采 一 条 流水 线 的 段 数 越 多 ,于 过 程 执 行 时 间 越 长 ,那么 ,这 条 流水 线 的 理论 耕 吐 
星 束 越 小 。 

加 速 比 (Speed Ratio) : 表示 流水 方式 相对 于 非 流 水 顺序 方式 速度 提 融 的 比值 ， i 
是 指 某 一 流水 线 如 果 采 用 串 行 模式 之 后 的 工作 速度 和 采用 流水 线 模式 后 的 工作 速度 的 
值 。 可 以 看 出 , 效 信 越 大 ,说 明 这 条 流水 线 的 工作 安排 方式 越 好 。 re 
执行 时 间 均 为 At ,流水 段 有 mm 个 段 ,那么 nn 个 任务 非 流 水 顺序 完成 需要 nn XmxXAt 的 时 间 ; 
流水 完成 则 需要 mAt 十 (n 一 1)At 的 时 间 , 因 此 ,流水 方式 工作 的 加 速 比 为 

ne*me* At 1 


国 mAt (no 1)At 国 ] 十 到 一 ] 
nr 


所 以 在 流水 线 各 子 功 能 段 执 行 时 间 均 相等 的 情况 下 , 仪 当 nn 写 m 时 ,其 加 速 比 才能 趋 近 
于 最 大 值 冯 , 即 流 水 线 的 段 数 。 

效率 (Efficiency): 也 称 流 水 线 设 备 的 时 间 利 用 率 ,又 称 使 用 效率 , 它 指 的 是 流水 线 中 各 
个 部 件 的 利用 率 ,也 就 是 设备 的 实际 使 用 时 间 占 整个 运行 时 间 的 比 但 。 显 然 , 效 率 总 是 小 于 
100% 的 ,这 是 由 于 流水 线 在 开始 工作 时 存在 建立 时 间 ， 在 结束 时 存在 排 空 时 间 ,各 个 部 件 
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不 可 能 一 直 在 工作 ,总 有 某 个 部 件 在 某 一 个 时 间 处 于 闲置 状态 ,这 同时 也 意味 着 可 以 用 处 于 
工作 状态 的 部 件数 量 和 总 部 件数 量 的 比值 来 粗略 地 说 明 这 条 流水 线 的 工作 效率 。 

如 果 是 线性 流水 线 , 任 务 间 不 相关 且 各 段 经 过 的 时 间 相 同 ,那么 以 图 8-10 为 例 , 在 工时 
间 里 流水 线 的 各 段 效 率 都 相同 , 均 为 mw ,整个 流水 线 的 效率 就 是 7。 


(a m m mm*T 
以 上 了 的 计算 公式 中 ,分 母 m， 工 正好 是 图 8-10 中 个 段 和 流水 总 时 间 工 所 围 成 的 
面积 ,分 子 m*，n*，Ato 则 是 图 8-10 时 空 图 中 个 任务 实际 使 用 的 面积 。 这 就 是 说 ,效率 实 


际 上 就 是 nn 个 任务 占用 的 时 空 区 面积 与 m 个 段 总 的 时 空 区 面积 的 比值 。 显 然 , 只 有 当 7 之 
1 时 ,7 才 趋 近 于 | 。 


8.2.4 流水 线 的 相关 问题 


流水 线 只 有 连续 不 断 地 流动 ,不 出 现 断 流 , 才 能 获得 高 效率 。 如 采 处 理 不 当 , 使 流水 线 
产生 “ 断 流 ”, 将 会 使 流水 效率 显 着 下 降 。 流 水 过 程 中 因为 相关 问题 而 产生 冲突 ,是 导致 流水 
线 断 流 的 主要 原因 ,一 般 来 讲 ,流水 线 的 相关 主要 分 为 以 下 三 种 类 型 。 


1. 结构 相关 


结构 相关 是 指 当 指令 在 重 登 执行 过 程 中 ,硬件 资源 满足 不 了 指令 重 登 执行 的 要 求 , 两 条 
或 两 条 以 上 指令 争 用 同一 资源 而 引起 的 冲突 ,因此 ,结构 相关 又 称 为 资源 相关 。 

例如 ,假设 一 条 指令 流水 线 由 5 段 组 成 ,分 别 为 取 指 令 (IF) .指令 译 码 (ID)、 取 操作 数 
(MEM) 执行 运算 


图 8-11 5 上段 指令 流水 线 


从 图 8-11 中 可 以 看 出 ,指令 工 的 取 操 作 数 和 指令 的 取 指 令 都 需要 访问 存储 器 。 若 
机 需 中 只 有 一 个 单 问 口 存 储 模 块 , 那 么 的 取 操 作 数 和 指令 L 的 取 指 令 就 产生 了 访 存 冲 
突 ,两 个 操作 无 法 同时 进行 ,这 就 是 一 种 典型 的 资源 冲突 。 

一 种 解决 这 种 冲突 的 方法 是 在 机 融 中 增加 存储 需 模 块 , 如 使 用 双 端 口 存储 希 , 使 指令 和 
数据 分 别 存放 在 不 同 的 存储 器 模块 中 ,这 样 , 取 操作 数 和 取 指 令 就 不 会 发 生 冲 突 。 另 一 种 方 
法 是 , 当 发 生 取 操作 数 或 取 指 令 冲 突 时 ,将 其 中 一 个 操作 的 执行 时 间 推 壕 , 如 图 8-12 所 示 。 
当然 ,这样 的 话 也 就 是 发 生 了 流水 线 的 断 流 , 流 水 线 的 吞吐 量 将 会 下 降 ，。 
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图 8-12 访 存 相关 引起 流水 线 断 流 
2. 数据 相关 


当 一 条 指令 需要 用 到 前 面 指令 的 执行 结 打 ,而 这 些 指 令 均 在 流水 线 中 重 登 执行 时 ,就 有 
可 能 产生 数据 相关 。 

在 流水 计算 机 中 ,指令 的 处 理 是 重 登 进行 的 ,前 一 条 指令 还 没有 绪 万 二 人 条 
就 陆续 地 开始 工作 。 由 于 多 条 指令 的 重合 处 理 , 当 后 继 指 | 刚好 是 前 一 此 
的 运算 结 末 时 , 便 发 生 数 据 相 关 冲 突 。 例 如 , 东 一 时 间 以 下 三 
执行 。 


ADD Ri, R,, R;; (R, ) 十 (R; ) 一 R， 
SUB R, ，R, ，R, ;， (Ri)—(R;)—R, 
AND Rs, Ri, Ri;; (Ri ) A(R; ) 一 R。 
其 中 ,SUB 指令 的 EX 段 需 要 执行 Rj 减 R; ,而 同一 时 间 , 其 上 一 条 指令 正在 执行 写 结果 到 
Ri 的 操作 。 这 种 情况 下 ,有 可 能 SUB 指令 的 Ri 并 不 是 ADD 指 令 最 终 形成 的 R， wy 
程序 的 执行 将 发 生 错 误 。 
数据 相关 包括 的 情况 很 多 ,如 主 存 操作 数 相 关 、 通 用 寄存 带 组 的 数 相 关 及 基 址 值 或 变 址 
值 相关 等 ,它们 都 属于 局 部 性 相关 ,都 是 由 于 在 机 硕 同 时 解释 多 条 指令 时 出 现 了 对 同一 主 存 
单元 或 寄存 冀 要 求 “ 先 写 后 读 ” 的 冲突 而 造成 的 。 解 决 这 种 相关 的 一 种 方法 是 推 后 后 续 指 令 
对 相关 单元 的 读 , 保 证 在 先 的 指令 写 和 信 先 完成 。 例 如 ,对 于 上 面 的 例子 ,为 了 保证 上 述 指令 
序列 执行 的 正确 性 ,流水线 只 能 暂停 SUB 指令 的 执行 ,直到 ADD 指令 将 结果 写 人 Ri 寄存 
器 后 ,再 启动 SUB 指令 的 执行 。 
另外 ,任务 在 流水 线 中 的 流动 顺序 的 安排 和 控制 可 以 有 两 种 方式 。 一 种 是 任务 流入 和 
流出 的 顺 夺 一 致 , 称 为 顺 厅 流动 方式 或 同步 流动 方式 ; 为 一 种 是 任务 流出 和 流入 的 顺 友 可 
以 不 同 , 称 为 开 步 流动 方式 。 
例如 ,有 一 个 8 段 的 流水 线 , 其 中 第 2 段 是 读 段 ,第 7 段 是 写 段 ,如 图 8-13 所 示 。 一 串 
指令 hj 上 kmsn、… 依 次 流入 , 当 指 令 j 的 源 操作 数 地 址 与 指令 h 的 目的 操作 数 地 址 相 
同时 ,h 和 j 就 发 生 了 “ 先 写 后 读 ” 的 数 相 关 , 解 决 办 法 如 图 8-13 所 示 ,设置 “相关 和 直接 通 路 ”， 
让 h 的 结果 直接 写 人 j 所 要 访问 的 存储 单元 ,这 样 就 可 以 保证 j 读 到 的 操作 数 是 bh 写 人 的 结 
果 ; 此 外 , 当 流 水 线 采 用 异步 流动 方式 时 ,会 出 现 很 多 顺序 流动 不 会 发 生 的 其 他 相关 。 比 
如 , 奢 指 令 1、k 部 有 与 操作 且 写 人 同一 单元 时 ， 可 能 由 于 指令 i 执行 时 间 长 或 有 “ 先 写 后 读 ” 
相关 , 叉 会 } ' 现 指令 > kk 先 于 指令 Es i 到 这 “与 ”, 结 果 和 错误 地 使 得 该 单元 的 最 后 内 容 为 指令 1 的 ] 
与 人 结果 ， 这 种 要 求 在 先 的 指 令 先 写 入 ,在 后 的 指令 才 写 入 的 相关 为 “ 写 - 写 相 关 ”。 此 外 ， 
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当 指 令 i 的 读 操 作 和 指令 的 写 操 作 是 对 同一 单元 时 , 夺 由 于 指令 越过 指令 i 同 前 流 , 且 
它 的 与 操作 先 于 指令 i 的 读 操作 开始 前 完 忆 ,,， 那 指令 i 就 会 读 到 错误 的 数据 。 这 种 对 同一 单 
元 要 求 在 先 的 指令 先 读 出 ,在 后 的 指令 才 写 入 的 相关 称 为 “ 先 读 后 写 ” 相 关 。 对 于 这 两 类 相 
关 , 只 有 了 异步 流 动 时 才 可 能 发 生 , 同 步 ( 即 顺序 ) 流 动 是 不 可 能 发 生 的 ,解决 它们 的 办 法 就 古 


在 控制 机 构 上 要 保证 写 入 与 写 人 之 间 、 读 出 与 写 和 之 间 的 先后 顺序 不 变 。 


n ] ml | k i h 异步 流动 
入 人 地 直上 | ] 宝 23 2 i h 
k i h 天 出 ] 、h 相 天 
’ a 
| ’ 
| [ 
谈 段 相关 且 接 通路 写 段 


采用 异步 流动 和 有 顺序 流动 两 种 方式 ， 要 求 h 先 写 人 后 j 再 读 出 
图 8-13 顺序 流动 和 异步 流动 


3. 控制 相关 


控制 相关 冲突 是 由 转移 指令 引起 的 。 当 执行 转移 指令 时 ,依据 转移 条 件 的 产生 结果 ,可 
能 为 顺 夺 取 下 条 指令 ; 也 可 能 转移 到 新 的 目标 地 址 取 指 令 ,从 而 使 流水 线 发 生 断 流 。 

为 了 源 小 转移 指令 对 流水 线性 能 的 影 啊 ,第 见 的 解决 办 法 如 下 。 

1) 独 测 法 

顾名思义 ,猜测 法 就 是 当 遇 见 转移 指令 1 时 ,会 形成 两 个 分 文 ,i 十 1、i 十 2、… ,是 转移 
不 成 功 时 继续 执行 的 一 路 分 支 , 男 一 路 分 支 是 转移 成 功 时 转向 执行 指令 p~\p 十 1、: I 
水 豆 味 者 同时 解释 多 条 指令 ;1 进入 流水 线 后 ,后 面 到 底 是 执行 i 十 1 还 是 p 指令 令 要 等 指 
i 的 条 件 人 三 建立 以 后 才 知 道 , 而 1 的 条 件 码 建立 一 般 要 等 到 条 件 转移 指令 i1 快 流出 流水 二 
时 才 行 ,那么 在 没有 建立 i 的 条 件 码 之 前 ,i 之 后 的 指令 停顿 下 来 的 话 , 流 水 就 断 流 了 ,性 
能 肯定 下 降 。 为 了 不 断 流 ,可 采用 猜测 法 猜 取 i++1 和 pp 两 个 分 文中 的 一 个 继续 回 前 
流动 。 

可 是 , 猜 哪个 分 文 好 呢 ? 如 果 程 序 中 这 两 个 分 支 被 执行 的 概率 相近 的 话 , 应 首选 i 十 
分 支 , 因 为 至 少 它 已 经 取 进 了 指 缓 里 了 ,可 以 很 快 从 中 取出 指令 i 十 1 进入 流水 线 而 不 必 等 
待 。 反 之 ,因为 p 可 能 尚未 取 进 指 缓 , 需 花 时 间 访 存 取 出 ,导致 流水 断 流 。 如 果 两 个 分 支 视 
执行 的 概率 不 均等 的 话 , 当 然 还 是 选 融 概率 的 分 支 。 那 么 怎样 判断 两 者 谁 是 融 概 率 的 分 文 
呢 ? 一 种 办 法 是 静态 地 根据 转移 指令 类 型 或 程序 执行 期 间 转 移 的 历史 状况 来 预测 ,这 种 静 
态 策略 意味 着 需要 事先 对 大 量程 序 的 转移 类 型 和 转移 概率 进行 统计 , 且 不 一 定 能 保证 有 较 
高 的 猜测 准确 度 。 也 可 以 巴 用 动态 采 略 ,融和 是 由 凡 详 程 订 根 和 执 行 过 程 中 转移 的 历史 记录 
来 动态 扯 预测 未 来 可 能 的 转移 选择 

问题 是 ,不 管 怎么 猜 选 ,如 果 猜 对 了 倒 好 ， 可 要 是 猜 错 了 怎么 办 呢 ? 当然 是 尽快 回 到 原 
分 支点 去 转 和 人 执行 另 分 支 。 就 这 么 简单 吗 ? 当然 不 是 ,因为 猜 错 了 意味 着 分 支点 原先 的 
现场 很 可 能 已 被 修改 了 。 所 以 不 管 怎么 猜 选 ,都 要 能 保证 猜 错 时 可 恢复 原先 的 现场 信息 。 
解决 的 办 法 是 设置 后 援 寄 存 髓 ,把 那些 可 能 被 破坏 的 原始 状态 信息 都 用 后 援 寄 存 顺 保存 起 
来 ,一 旦 猜 错 就 取出 后 援 寄 存 顺 的 内 容 来 恢复 分 支点 的 现场 。 
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2) 加 快 和 提前 形成 条 件 碍 

尽快 尽早 地 获得 条 件 码 ,就 可 oo 

JW 加 快 单 条 指令 内 部 的 条 件 码 的 形成 ,尤其 是 某 些 反映 运算 结果 的 条 件 码 完全 可 以 不 
必 等 到 指令 执行 完 就 提前 形成 。 pmp ostream 吉 果 是 正 是 人 负 的 条 
件 码 就 完全 可 以 在 运算 前 形成 。 

@ 在 一 段 程序 内 提前 形成 条 件 码 ,比如 循环 程序 ,一 般 是 根据 循环 条 件 判 断 是 否 继 疆 
转移 。 很 多 循环 程序 的 循环 次 数 昌 然 是 在 循环 末 问 霹 句 对 循环 次 数 减 1, 然后 再 判断 循环 
次 数 是 否 为 0 来 决定 是 否 结 束 循环 的 。 细 想 一 下 不 难 发 现 , 循 环 次 数 减 1 和 判断 循环 次 效 
是 否 为 0 的 操作 ,完全 可 以 提前 完成 ,甚至 可 以 提前 到 循环 体 开始 时 就 进行 。 

3) 采用 延迟 转移 

米 用 延 人 壕 转 移 办 法 是 用 软件 方法 进行 神态 指令 调度 的 技术 ,就 是 在 编译 生成 目标 指令 
程序 时 ,将 条 件 转 移 指令 与 它 前 和 面 不 相关 的 一 条 或 多 条 指令 交换 位 置 , 让 成 功 转移 总 
到 在 这 一 条 或 多 条 指令 执行 之 后 由 进行。 延迟 转移 方法 因为 思路 简单 ,而 且 不 必 增 加 便 件 ， 
改 比较 实用 。 

4) 加 快 短 循环 程序 的 处 理 

QO 为 避 倪 短 循环 程序 取 进 了 指 组 后 ,由 于 指令 预 取 寻 致 指 组 中 需 循环 执行 的 指令 被 冲 
挥 ,为 减少 访 存 次 数 , 可 将 短 循环 程序 一 次 性 整个 地 站 入 指 绥 内 ,以 加 快 短 循环 程序 的 人 处理。 

co 由 于 循环 分 支 概 率 高 ,让 循环 出 口 问 的 条 件 转移 指令 但 猜 循环 分 支 , 就 可 以 降低 因 
为 条 件 分 文 而 造成 的 流水 线 断 流 的 概率 。 


8.2.5 超 流 水 线 技术 
. 超标 量 处 理 机 


机 下 


假设 一 条 指令 包含 取 指 令 . 译 码 .执行 和 存 结果 4 个 子 过 程 ,每 个 子 过 程 经 过 的 时 间 为 
At。 第 规 标 量 单 流 水 处 理 机 是 在 每 个 Ar 期 间 解 释 完 一 条 指令 ,如 图 8-14 所 示 。 完 成 9 个 
任务 需要 12At 的 时 间 , 称 这 种 流水 机 的 度 区 二 1 
闻 件 
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8-14 常规 ( 度 m 二 1) 标 量 流水 处 理 机 时 空 图 


超标 量 处 理 机 则 采用 多 指令 流水 线 , 每 个 At 同时 流出 mm 条 指令 (7 就 是 度 )。 图 8-15 
是 m 二 3 时 的 流水 时 空 图 ,每 3 条 指令 为 一 组 ,执行 完 9 条 指令 只 需 6At。 

超标 量 流 水 线 处 理 机 中 配置 多 套 功能 部 件 .指令 译 码 电路 和 多 组 总 线 , 寄 存 器 也 备 有 多 
个 问 口 和 多 组 总 线 。 程 序 运 行 时 由 指令 译 码 部 件 检 测 顺序 取出 的 指令 之 间 是 否 存在 数据 相 
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天 和 功能 部 件 争 用 情况 ,将 可 以 并 行 的 相 邻 指令 送 往 流 水 线 。 度 六 二 1 是 超标 量 流 水 机 的 
特例 ,并 行 度 为 1 驶 逐条 执行 。 超 标量 流水 线 处 理 机 较 容 易 实 现 ,主要 靠 编 详 来 优化 编排 指 
令 的 顺 厅 ,将 可 并 行 的 指令 措 配 成 组 ,人 硬件 就 不 再 调整 指令 的 顺序 。 
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图 8-15 m= 二 3 时 的 超标 量 流 水 时 空 图 
超标 量 流 水 线 处 理 机 的 昌 型 代表 有 Intel 公司 的 1860 .1960、Pentium 处 理 机 ,Motolora 
公司 的 MC88110,IBM 公司 的 Power 6000,Sun 公司 的 SuperSPARC 等 。 
2. 超 流 水 线 处 理 机 


如 果 超 流水 线 处 理 机 的 度 用 和 2 表示 ,一 个 机 器 周期 为 At ,那么 把 机 器 周期 分 为 m 个 子 
周期 ,每 个 子 周期 表示 为 At ,At = 二 At/m, 那 么 每 个 At 可 以 流出 一 条 指令 。 用 上 表示 一 条 
指令 所 含 的 基本 机 需 周 期 数 , 那 么 一 条 指令 需 花 kmAr 的 时 间 , 如 图 8-16 所 示 。 
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度 m= 二 3 的 超 流 水 线 时 空 图 


马 前 面 的 超标 量 处 理 机 相 比 ,超标 量 处 理 机 看 重 利 用 资源 重复 ,设置 多 个 执行 部 件 琳 存 
售 堆 端口 ,而 超 流 水 线 处 理 机 则 者 重 开 发 时 间 的 并 行 性 。 


超 流 水 线 处 理 机 的 典型 代表 有 SGI 公司 的 MIPS R4000、R5000、R10000 等 。 


3. 超标 量 超 流 水 线 处 理 机 


将 前 面 有 所 讲 的 超标 量 流 水 线 与 超 流 水 线 机 相 结 合 就 形成 了 超标 量 超 流 水 线 处 理 机 。 超 
标量 超 流水 线 处 理 机 在 一 个 At 时 间 内 发 射 了 & 条 指令 (超标 量 )。 每 次 发 射 时 间 错 开 Ar 
( 超 流水 ) ,相当 于 每 拍 At 流出 了 nk 条 任务 ,并行 上 度 为 区 一 kn。 

例如 ,如 图 8-17 所 示 ,k 二 3,n 二 3, 并 行 度 区 二 9, 完 成 12 个 任务 就 需 5At, 完 成 21 个 任 


务 就 日 需 6At。 任 务 
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多 ,超标 量 超 流水 线 处 理 机 的 性 能 优势 就 越 明显 。 
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图 8-17 并 行 度 mm 二 9 的 超标 量 超 流水 线 时 空 图 


超标 量 超 流水 线 处 理 机 的 典型 代表 有 DEC 公司 的 Alpha 等 . 


超标 量 是 通过 内 置 多 条 流水 线 来 


同时 执行 多 个 处 理 囊 的 ,其 实质 是 以 空间 换取 时 间 的 。 


而 超 流水 线 是 通过 细 化 流水 .提高 主 频 ,使 得 在 一 个 机 豆 周 期 内 完成 一 个 甚至 多 个 操作 ,其 
实质 是 以 时 间 换 取 空 间 的 。 如 Pentium 4 的 流水 线 就 长 达 20 级 。 流 水 线 设 计 的 步 ( 级 ) 越 
长 ,其 完成 一 条 指令 的 速度 就 越 快 ,因此 才能 适应 工作 主 频 更 高 的 CPU。 但 是 流水 线 过 长 


也 会 市 来 了 一 定 的 副作用 ,很 可 


全 
能 会 


出 现 主 频 较 高 的 CPU 实际 运算 速度 较 低 的 现象 ,Intel 
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的 Pentium 4 就 出 现 了 这 种 情况 ,虽然 它 的 主 频 可 以 高 达 1. 4GB 以 上 ,但 其 运算 性 能 却 远 
记 比 不 上 AMD 1.2GB 的 速度 甚至 Pentium 册 。 


4. 龙 世 2E 增强 型 处 理 器 芯片 的 流水 线 


龙芯 2E(Longson 2E) 是 一 款 国 产 实 现 64 位 MIPS 亚 指 令 集 的 通用 RISC 处 理 器 ,如 

图 8-18 所 示 。 采 用 90nm 的 CMOS 工艺 ,布线 层 为 七 层 铜 金属 ,芯片 晶体 管 数 目 为 4700 

万 , 心 片 面积 6.8mmxX5. 人 1GHz, 上 典型 工作 频率 为 800MHz, 实 测 功 耗 

5~~7W。 龙 芯 2E 具有 片上 128KB 一 级 缓存 .512KB 二 级 缓存 , 单 精度 峰值 浮 点 运算 速度 

为 80 亿 次 / 秒 , 双 精 度 冬 点 运算 速 pr 40 亿 次 / 秘 , 在 1GHz 主 频 下 SPEC CPU 2000 的 实 

测 分 值 达 到 500 分 ,综合 性 能 已 经 达到 高 问 Pentium 用 以 及 中 低 问 Pentium 4 处 理 人 船 的 
wk。 


龙芯 2E 的 基本 流水 线 包 括 取 指 、 预 幸 码 、 译 人 码 、 寄 存 冀 带 
命名 .调度 .发射 . 读 寄存 器 ,执行 .提交 9 级 ,每 一 级 流水 包括 
> 0 以 下 操作 
pcm | | (1) 取 指 流水 级 用 程序 计数 器 (PC) 的 值 去 访问 指令 cache 

6 全 司 蝇 和 指令 TLB, 如 果 指 令 cache 和 指令 TLB 都 命中 , 则 把 4 条 新 
的 指 : 令 取 到 指令 令 寄 存 郁 (CIR) 。 

(2) 预 译 码 流水 级 主要 对 转移 指令 进行 译 码 并 j 
的 方 问 。 

(3) 译 码 流水 级 把 IR 中 的 4 条 指令 转换 成 龙芯 2E 的 内 
部 指令 格式 送 往 寄存 郑重 命名 模块 。 

(4) 寄存 器 重 命名 流水 级 为 逻辑 目标 寄存 器 分 配 一 个 新 的 物理 寄存 器 ,并 将 逻辑 源 寄 
存货 映射 到 最 近 分 配给 该 逻辑 寄存 冀 的 物理 寄存 疾 。 

(5) 调度 流水 级 将 重 命 名 的 指令 分 配 到 定点 或 浮 点 保留 站 中 等 每 执行 ,同时 送 到 ROQ 
中 用 于 执行 后 的 顺序 提交 ; 此 外 ,转移 指令 和 访 存 指令 还 分 别 被 送 往 转 移 队 列 和 访 存 队列 。 

(6) 发 射流 水 级 从 定点 或 浮 点 保留 站 dda 部 件 选 出 一 条 所 有 et 
aia Wi 通过 侦 听 结果 总 线 和 forward 总 线 等 待 它 的 


测 跳 转 


图 8-18 龙 必 2E 处 理 带 


(7) 读 寄存 器 流水 级 为 发 射 的 指 旨 令 从 物理 寄存 前 推 中 谈 取 相应 的 滨 操 作 数 送 到 相应 的 
功能 部 件 。 

(8) 执行 流水 级 根据 指令 的 类 型 执行 指令 并 把 计算 绪 末 写 回 寄存 融 推 
往 保 留 站 和 寄存 右 草 命名 表 , 通 知 相 应 的 寄存 癌 但 已 经 可 以 使 用 了 ， 

(9) 提交 流水 级 按照 Reorder 队列 记录 的 程序 的 顺序 提交 已 经 执行 完 的 指令 , 龙 必 2E 
最 多 每 拍 可 以 提交 4 条 指令 ,提交 的 指令 送 往 寄 人 存 末 重合 名 表 用 于 确认 它 的 目的 寄存 硕 的 
重 命 名 关系 并 释放 原来 分 配给 同一 逻辑 寄存 硕 的 物理 寄存 着 ,并 送 往 访 存 队 列 人 允许 那 些 提 
区 的 存 数 指令 写 人 cache 或 内 存 。 

上 述 是 其 基本 指令 的 流水 级 ,对 于 一 些 较 复 杂 的 指令 
及 访 存 指 令 ,在 执行 阶段 需要 多 提 。 


; 纺 末 总 线 还 适 


8 3 多 处 理 机 系统 


多 处 理 机 系统 属于 并 行 处 理 技术 中 的 一 种 空间 并 行 , 它 通过 使 用 多 个 处 理 机 同时 执行 
程序 从 而 提高 系统 的 性 能 。 本 节 首 先 介 绍 多 处 理 机 系统 的 分 类 ,然后 介绍 多 处 理 机 系统 的 
相关 技术 ,如 由 多 处 理 机 引起 的 cache 一 致 性 .多 处 理 机 操作 系统 及 多 处 理 机 系统 的 并 行 性 
实现 等 。 


8.3.1 多 处 理 机 系统 分 类 


具有 能 同时 执行 多 个 任务 或 多 条 指令 或 同时 对 多 个 数据 项 进行 处 理 的 计算 机 系统 统称 
为 并 行 处 理 计算 机 系统 ,包括 阵列 计算 机 、 回 量 计算 机 、 多 处 理 机 系统 和 多 计算 机 系统 。 

按照 前 面 讲 到 的 Flynn 分 类 法 ,计算 机 系统 可 分 成 4 类 , 即 单 指令 流 单 数据 流 (SISD) 
系统 、 单 指令 流 多 数据 流 (SIMD) 系 统 、 多 指令 流 单 数据 流 (MISD) 系 统 和 多 指令 流 多 数据 
流 (MIMD) 系 统 。 阵 列 计算 机 和 向 量 计算 机 属于 SIMD 系统 ,它们 通过 使 用 多 个 处 理 右 同 
时 对 多 个 数据 进行 处 理 , 从 而 提高 机 第 的 数据 处 理 能 力 , 这 类 机 责 对 于 效 组 或 回 量 运 算 具 有 
较 高 的 性 能 ,常用 于 如 图 像 处 理 .具有 癌 量化 运算 的 科学 计算 领域 等 。 

多 处 理 机 系统 和 多 计算 机 系统 都 属于 MIMD 系统 ,但 相 比 较 而 言 ,两 者 具有 很 大 的 不 
同 。 多 处 理 机 系统 是 指 两 个 或 两 个 以 上 处 理 机 通过 高 速 互 联网 络 连 接 起 来 ,在 统一 的 操作 
系统 管理 下 ,实现 指令 以 上 级 (任务 级 .作业 级 ) 并 行 。 多 计算 机 系统 则 是 由 多 个 独立 的 计算 
机 组 成 的 ， 它们 通过 共 种 廊 式 连接 起 来 ,实现 并 行 处 理 或 计算 。 一 般 来 讲 , 多 计算 机 系统 属 
于 松 耘 合 系统 ,构成 系统 的 可 以 是 独立 的 计算 机 ; 而 多 处 理 机 系统 更 多 属于 紧 夸 合 系 统 , 各 
人 处理 机 既 独 立 又 联系 紧密 ,如 通过 共 圣 存储 冀 互 连 等 。 

从 目前 的 实际 应 用 来 看 , MIMD 系统 是 并 行 处 理 计 算 机 系统 中 的 主流 ,而 多 人 处理 机 系 
统 又 在 MIMD 系统 中 占据 了 主导 地 位 。 

MIMD 之 所 以 能 成 为 现代 高 性 能 计算 机 系统 的 主流 体系 结构 ,主要 是 因为 以 下 两 点 : 

(1) 灵活 性 好 。 通 过 适当 的 软 便 件 文 持 ,MIMD 可 岂 用 作 呈 用 站 针对 一 个 应 用 程序 
过 挥 其 高 性 能 ; 也 可 以 用 作 多 道 程序 机 责 , 同 时 运行 多 个 任务 ; 还 可 以 是 这 两 种 功能 的 组 合 。 

(2) 性 价 比 好 。MIMD 可 以 充分 利用 商品 化 微 处 理 器 在 性 能 价格 比方 面 的 优势 。 实 际 
上 , 现 有 的 多 处理 机 系统 几乎 部 米 用 与 工作 站 和 单 处 理 机 服务 各 相同 的 微 处 理 右 作为 其 处 

根据 多 处 理 机 系统 的 组 成 结构 来 分 , 现 有 的 多 人 处理 机 系统 主要 包括 : 对 称 式 共 至 存储 
作 结 构 多 处理 机 系统 (Symmetric shared-memory MultiProcessor,SMP) ,分布 式 共享 存储 

结构 多 处 理 机 系统 (Distributed Shared Memory,DSM) 和 大 规模 并 行 处 理 机 (Massively 
Parallel Processor ,MPP) 等 。 


1. 对 称 式 共 至 存储 屁 多 处 理 机 


通常 SMP 系统 使 用 商品 微 处 理 表 (具有 上 请 上 或 外 置 高 速 缓存 ) 作 为 其 处 理 机 ,它们 经 
由 互联 网 络 与 一 个 共 圣 存储 全 互 连 。 共 于 存储 人 可 以 被 所 有 处理 带 通过 互联 网 络 进行 访 
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问 ,就 如 同一 个 单 处 理 硕 访问 它 的 存储 融 一 样 。 所 有 处 理 带 对 任何 存储 单元 有 相同 的 访问 
时 间 。 互 联网 络 可 以 是 单 总 线 、 多 总 线 或 者 交叉 开关 。 因 为 对 共享 存储 右 的 访问 是 平衡 的 
每 个 处 理 右 有 相等 的 机 会 读 / 写 存储 器 ,也 有 相同 的 访问 速度 , 故 这 类 系统 就 称 为 对 称 多 处 
理 机 (CSMP) 。 因 为 这 种 对 称 多 处 理 需 的 存储 占 是 共享 的 ,所 以 又 称 为 共享 存储 髓 多 处 理 机 
天 统 。SMP 系统 的 体系 结构 如 图 8-19 所 示 。 

对 称 多 处 理 器 的 优点 是 并 行 度 高 。 因 为 系统 是 对 称 的 ,每 个 处 理 器 可 等 同 地 访问 共享 
存储 闫 IO 设备 和 操作 系统 服务 。 这 种 对 称 使 得 系统 能 开 折 较 高 的 并 行 度 。 但 因为 共享 
存储 天 ,系统 总 线 的 市 宽 是 有 限 的 ,就 限制 了 系统 中 的 处 理 病 不 能 太 多 (一 般 少 于 64 个 ), 同 
时 总 线 和 交叉 开关 互 连 一 旦 做 成 也 难以 扩展 。 


2. 分 布 式 共 至 存储 冀 多 处理 机 


分 布 式 共享 存储 器 多 人 处理 机 (DSM) 具 有 分 布 的 物理 存储 右 。 为 支持 更 大 数目 的 人 处理 
机 ,存储 希 必 须 分 布 到 各 个 处 理 机 上 ,而 非 集中 式 , 否 则 存储 骨 系 统 将 不 能 满足 处 理 机 刺 宽 
的 要 求 。 系 统 将 物理 上 分 散 的 各 台 人 处 理 机 所 拥有 的 局 部 存储 器 在 逻辑 上 统一 编 址 ,形成 一 
个 统一 的 虚拟 地 址 空间 ,以 实现 存储 器 的 共享 。 其 存储 项 采用 cache 目录 表 来 支持 分 布 高 
速 cache 的 一 致 性 。 系 统 中 每 个 节点 均 包 含 了 了 处理 机 存储器、1/O 以 及 互联 网 络 接口 。 
DSM 系统 的 体系 结构 如 图 8-20 所 示 。 


CPU CPU CPU 


| 
\ 
cache cache cache LIM 
cache | [eache | | cache LIM_ 
互联 网 络 \ 
IO 万 联网 络 


SM : 共 旱 仔 储 硬 LM: 局 部 仔 储 闸 NIC: 网 络 接 口 


图 8-19 ”对 称 式 共 享 存 储 顺 结构 图 8-20 ”分 布 式 共 享 存储 器 结构 
多 处 理 机 系统 多 人 处理 机 系统 DSM 


将 存储 器 分 布 到 各 节点 有 两 个 好 处 : 第 一 ,如 果 大 多 数 的 访问 针对 本 节点 的 局 部 存储 
器 , 则 可 降低 对 存储 器 和 互联 网 络 的 带宽 要 求 ; 第 二 ,对 局 部 存储 器 的 访问 延迟 低 ， 

DSM 和 SMP 的 主要 差别 是 : SMP 中 的 处 理 机 没有 自己 的 局 部 存储 器 ,系统 的 存储 器 
是 由 所 有 处 理 机 共享 的 ; 而 DSM 将 存储 器 在 物理 上 分 布 到 各 处 理 机 中 ,并 进行 统一 编 址 ， 
形成 一 个 共享 的 虚拟 存储 器 。 随 着 处 理 器 性 能 的 迅速 提高 和 处 理 器 对 存储 器 带宽 的 要 求 不 
断 提 高 ,甚至 在 较 小 规模 的 多 处 理 机 系统 中 ,采用 分 布 式 存储 器 结构 也 优 于 采用 对 称 式 共享 
存储 器 结构 。 


3. 大 规模 井 行 处 理 机 


庞大 的 数据 量 .异常 复杂 的 运算 . 极 不 规则 的 数据 结构 和 极 高 的 处 理 速 度 , 这 些 是 高 科 


技 应 用 领域 对 计算 机 和 通信 网 络 在 计算 .处理 和 通信 性 能 上 不 断 提 出 的 更 高 的 要 求 ; 尤其 
是 科学 计算 中 的 重大 诗 题 都 要 求 计 算 机 系统 能 提供 3T 性 能 , 即 Teraflops 计算 能 力 ， 
TeraByte 主 存储 天 ,TeraByte/s 输入 输出 频 市 宽度 ;: 于 是 伴随 着 VLSI 技术 和 微 处 理 技术 
的 发 展 , 大 规模 并 行 处 理 机 (MPP) 就 成 了 20 世纪 80 年 代 中 期 计算 机 发 展 的 热点 。 

MPP 一 般 是 指 超大 型 (Very Large-Scale) 并 行 计 算 机 系统 ,大 规模 并 行 处 理 需要 有 新 
的 计算 方法 、 存储 技术 .处 理 手段 和 结构 组 织 方 式 。 实 现 的 方法 是 将 数目 万 至 数 千 个 高 性 
能 、 低 成 本 的 RISC 微 处 理 器 用 专门 的 互联 网 络 互 连 ,组 成 大 规模 并 行 处 理 机 (MPP)。 这 种 
处 理 机 可 进行 中 粒度 和 细 粒 度 大 规模 并 行 处 理 , 构 成 SIMD 或 MIMD 系统 ,其 优点 在 于 它 
具有 高 性 价 比 ,并 且 可 扩展 性 很 好 。 

MPP 一 般 具 有 以 下 特性 : 

(1) 处 理 节 点 来 用 商品 币 处 理 套 ; 

(2) 系统 中 有 物理 上 的 分 布 存储 斯 ; 

(3) 采用 高 通信 带宽 和 低 延 迟 的 互联 网 络 (专门 设计 和 定制 的 ); 

(4) 能 扩 放 至 成 百 上 千 个 处 理 器 ; 

(5) 它 是 一 种 异步 的 MIMD 机 器 ,程序 由 多 个 进程 组 成 ,每 个 都 有 其 私有 地 址 空间 , 进 
程 间 采用 传递 消息 相互 作用 。 

大 规模 并 行 处 理 机 (MPP) 系 统 采用 的 技术 主要 是 VLSI 可 扩展 技术 和 共享 虚拟 存储 
技术 ; 其 适用 的 领域 主要 是 科学 计算 、 工 程 模 拟 和 信号 处 理 等 以 计算 为 主 的 一 些 重 大 课题 
和 领域 。 比 如 全 球 气 候 了 预报、 基因 工程 、 飞 行动 力学、 海洋 环流 ,流体 动力 学 、 超 导 建 模 、 半 于 


8.3.2 多 人 处理 机 的 cache 一 致 性 


在 单 处 理 机 系统 中 ,cache 一 致 性 问题 只 存在 于 cache 与 主 存 之 间 , 即 使 有 1/0O 通道 共 
享 cache 亦 可 通过 全 写法 或 回 写 法 较 好 地 加 以 解决 。 在 紧 耦 合 多 处 理 机 系统 中 ,如 果 采 用 
全 写法 ,也 只 能 维持 一 个 cache 和 主 存 之 间 的 一 致 性 ,不 能 自动 更 新 其 他 处 理 机 中 的 cache 
的 相同 副本 ,所 以 解决 不 了 多 人 处理 机 中 cache 之 间 的 一 臻 性。 解决 多 处 理 机 系统 中 cache 的 
一 致 性 问题 是 研究 多 处 理 机 技术 中 的 一 个 重要 问题 。 


1. 实现 cache 一 致 性 的 基本 方案 


实现 cache 一 致 性 的 方法 有 多 种 ,大 体 分 为 两 类 : 一 类 是 软件 方法 , 男 一 类 是 硬件 方 
法 。 软 件 解决 方法 的 思路 是 : 在 程序 的 编译 阶段 解决 问题 ,即使 用 编译 程序 对 程序 代码 进 
行 cache 一 致 性 分 析 ,确定 什么 样 的 数据 项 可 能 会 造成 cache 的 不 一 致 性 ,然后 相应 地 标记 
出 这 些 项 ,最 后 由 操作 系统 或 硬件 来 防止 这 些 数据 项 用 于 cache。 

软件 方法 的 优点 是 : cache 的 一 致 性 问题 的 解决 在 编译 时 实现 ,使 复杂 的 机 器 硬件 系统 
设计 变 得 简单 。 其 缺点 是 : 在 编译 时 进行 的 保守 判决 会 导致 一 些 不 会 引起 cache 一 致 性 的 
据 项 可 能 也 会 禁止 被 cache 引用 ,从 而 导致 cache 利用 率 的 下 降 。 一 般 来 讲 , 硬 件 的 方法 
比 软件 的 方法 效率 更 高 ,而且 ,硬件 的 方法 对 于 程序 员 和 编译 程序 来 说 都 是 透明 的 ,也 减轻 
了 软件 研制 的 开销 。 因 此 ,在 多 处 理 机 系统 中 更 多 采用 的 是 硬件 方法 。 

基于 便 件 的 方法 又 称 为 cache 一 致 性 协议 ,通过 对 运行 过 程 中 共 章 数据 块 状态 的 跟 踢 
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和 潜在 的 不 一 人 致 条 件 的 动态 识别 ,来 阻止 相关 数据 对 cache 的 使 用 。 硬 件 的 方法 又 分 成 两 
大 类 . 目录 协议 (Directory Protocol) 和 监听 协议 (Snoopy Protocol)。 这 些 方 法 主要 体现 在 
具体 实现 上 的 不 同 , 如 数据 块 状态 信息 保存 在 何 处 ,信息 是 如 何 组 织 的 ,在 何人 处 实施 一 致 性 
以 及 实施 一 致 性 机 构 的 组 织 等 。 

目录 协议 是 在 主 存 中 保存 一 个 目录 ,记录 了 共有 盏 数据 块 的 状态 及 相关 信息 ,由 一 个 集中 
控制 右 ( 主 存 控 制 血 的 一 部 分 ) 对 该 目录 进行 集中 管理 和 维护 ,通过 该 目录 来 跟 躁 运行 过 程 
中 共 圣 数据 块 的 状态 ,并 对 潜在 的 不 一 致 条 件 进 行动 态 识别 。 

监听 协议 是 每 个 处 理 机 cache 除了 包含 主 存储 器 中 的 数据 拷贝 之 外 ,也 保存 着 各 个 
据 块 的 共享 状态 信息 ,各 个 处 理 机 的 cache 控制 器 通过 监听 共享 存储 器 总 线 来 判断 是 否 有 
总 线 上 请 求 的 数据 块 ,从 而 对 这 些 数 据 块 进行 跟踪 和 人 处理 。 

在 使 用 多 个 处 理 机 , 且 每 个 处 理 机 的 cache 部 与 共 圣 存储 冀 相 连 组 成 的 多 人 处理 机 系统 
中 ,一 般 都 采用 以 上 基于 写作 废 模式 的 监听 协议 。 


2. 昨 听 协议 


可 以 使 用 两 种 方法 来 维持 以 上 所 讲 的 一 致 性 要 求 : 写作 废 协议 和 写 更 新 协议 。 

写作 上 废 协议 (Write Invalidate) 是 在 一 个 处 理 机 写 某 数据 块 后 , 知 新 写 人 主 存储 占 中 的 
数据 与 其 他 cache 拷贝 中 的 数据 不 一 致 , 则 使 所 有 其 他 cache 拷贝 中 的 数据 作废 。 这 样 的 
话 ,今后 某 个 处 理 机 对 该 数据 进行 读 时 会 产生 读 失效 ,于 是 从 主 存储 般 中 将 该 块 调 人 cache， 
该 处 理 机 的 cache 又 与 主 存 储 逢 保持 一 致 了 。 

写 更 新 协议 是 当 一 个 处 理 机 写 某 数据 项 时 ,通过 广播 使 其 他 处 理 机 的 cache 中 所 对 应 
的 数据 项 拷贝 也 同时 更 新 。 为 减少 协议 所 需 的 市 宽 , 应 知道 cache 中 该 数据 项 是 否 为 共 盏 
状态 ,也 就 是 别 的 处 理 机 cache 中 是 否 也 存在 该 数据 项 拷贝 。 如 采 不 是 共 圣 数据 , 则 瑟 时 就 

在 基于 总 线 的 多 处 理 机 中 ,总 线 和 存储 天 市 宽 是 最 紧缺 的 资源 ,因此 与 作废 协议 成 为 绝 
大 多 数 系统 设计 的 选择 。 当 然 , 在 设计 小 数目 处 理 机 (2 一 4 个 ) 的 多 处 理 机 系统 时 ,各 个 处 
理 机 紧密 相连 ,更 新 所 要 求 的 市 宽 还 可 以 接 有 党。 尽管 如 此 ,考虑 到 存储 天性 能 和 相关 市 宽 要 
求 的 增长 ,更 新 模式 很 少 及 用 。 

对 于 监听 协议 , 当 某 个 处 理 机 进行 写 数据 时 ,必须 先 获 得 总 线 的 控制 权 , 然 后 将 写 人 的 
数据 块 地 址 放 到 总 线 上 ,该 地 址 也 是 其 他 处 理 机 要 作废 的 cache 数据 块 地 址 。 其 他 处 理 机 

直 监 昕 总线, 它们 检测 该 地 址 所 对 应 的 数据 是 否 在 它们 的 cache 中 。 千 在, 则 作废 相应 的 
效 据 其 ,否则 不 子 理 睐 。 

当 某 个 处 理 机 瑟 cache 未 命中 时 ,除了 将 其 他 处 理 机 上 相应 的 cache 数 本 上 
要 从 主 存储 天 取出 该 数据 块 。 对 于 采用 全 写法 的 cache, 因 为 所 有 写 cache 的 数据 同时 被 于 
回 主 存 , 则 从 主 存 中 总 可 以 取 到 最 新 的 据 值 。 而 对 于 采用 写 回 法 的 cache, 得 到 数据 的 最 
新 值 就 会 困难 一 些 , 因 为 最 新 值 可 能 在 某 个 处 理 机 的 cache 中 ,也 可 能 在 主 存 中 。 在 cache 
失效 时 可 使 用 相同 的 监听 机 制 , 每 个 处 理 机 都 监听 放 在 总 线 上 的 地 址 ,如 果 发 现 某 个 处 理 机 
含有 被 请 求 数据 块 的 一 个 已 修改 过 的 拷贝 , 它 就 将 这 个 数据 块 送 给 发 出 读 请 求 的 处 理 机 ,并 
于 止 其 对 主 存 的 访问 请 求 。 

进入 20 世纪 90 年 代 以 后 ,几乎 所 有 的 通用 微 处 理 机 蕊 片上 部 添加 了 支持 监视 cache 


协议 的 功能 。 采 用 最 多 的 是 一 种 基于 监听 协议 的 MESI 协议 。 该 协议 是 用 协 记 
4 种 状态 即 Modified( 修 改 )、Exclusive( 独 占 )、Shared( 共 诗 ) 和 Invalid( 无 效 ) 的 首 字 母 来 命 
名 的 。 这 个 协议 中 每 个 cache 项 都 处 于 下 面 4 种 状态 之 一 。 

(1) 修改 (Modified): 该 项 的 数据 是 有 效 的 ,但 内 存 中 的 数据 是 无 效 的 ,而 且 在 其 他 
cache 项 中 没有 该 项 数据 也 

(2) 独占 (Exclusive): 没有 其 他 的 cache 项 包括 这 行 数据 ,内 存 中 的 数据 是 最 新 的 。 

(3) 共享 (Shared) : 多 个 cache 项 中 都 有 这 行 数据 ,内 存 中 的 数据 才 是 最 新 的 。 

(4) 无 效 (Invalid): 该 cache 项 包含 的 数据 无 效 。 

大 多 数 x86 架构 的 CPU 都 采用 这 种 MESI 协议 ,如 Power PC601、M88110 .Intel 的 
Pentium 和 1860、AMD K6 及 以 后 的 一 些 产 品 中 ,都 采用 了 此 种 方法 。 


8.3.3 多 处 理 机 操作 系统 


多 处 理 机 操作 系统 目前 主要 有 三 种 类 型 : 主 从 式 操作 系统 、 独 立 监 上 上 
动 监督 式 操作 系统 。 


1. 主 从 式 操 作 系 统 


主 从 式 操 作 系 统 (Master-Slave) 由 一 人 台 主 处 理 机 记录 、 控 制 其 他 从 处 理 机 的 状态 ,并 分 
配 任 务 给 从 处 理 机 。 例 如 ,Cyber-170 采用 的 就 是 主 从 式 多 处 理 机 操作 系统 , 它 驻 留 在 一 个 
外 围 处 理 机 P。 上 运行 ,其 余 所 有 的 处 理 机 包括 中 心 处 理 机 都 从 属于 P。。 男 一 个 例子 是 
DEC System 10, 它 有 两 台 人 处 理 机 ,一 台 为 主 , 男 一 台 为 人 从。 操作 系统 在 主 处 理 机 上 运行 ,从 
处 理 机 的 请 求 通过 线路 传送 给 主 处 理 机 ,然后 主 处 理 机 回答 并 执行 相应 的 服务 操作 。 主 从 
式 操 作 系 统 的 监控 程序 及 其 提供 服务 的 过 程 不 必 迁 移 , 因 为 只 有 主 处 理 机 利用 它们 。 当 不 
可 恢复 错误 发 生 时 ,系统 很 容易 导致 月 溃 , 此 时 必须 重新 启动 主 处 理 机 。 由 于 主 处 理 机 的 责 
任 重 大 , 当 它 来 不 及 处 理 进 程 请 求 时 ,其 他 从 属 处 理 机 的 利用 率 就 会 随 之 降低 。 

主 从 式 操 作 系 统 有 以 下 特点 : 

(1) 操作 系统 程序 在 一 台 处 理 机 上 运行 。 如 果 从 处 理 机 需要 主 处 理 机 提供 服务 , 则 癌 
主 处 理 机 发 出 请 求 , 主 处 理 机 接受 请 求 并 提供 服务 。 不 一 定 要 求 把 整个 管理 程序 都 编写 成 
可 重 入 的 程序 代码 ,因为 只 有 一 个 处 理 机 在 使 用 它 , 但 有 些 公 用 例 程 必须 是 可 重 入 的 才 行 。 

(2) 不 存在 管理 表格 存 取 冲突 和 访问 阻塞 问题 。 

(3) 当主 处 理 机 故障 时 很 容易 引起 整个 系统 的 朋 深 。 如 果 主 人 处理 机 不 是 固定 六 
管理 员 可 从 其 他 处 理 机 中 选 一 个 作为 新 主 处 理 机 并 重新 局 动 系统 。 

(4) 任务 分 配 不 当 容 易 使 部 分 从 处 理 机 闲置 ,从 而 导致 系统 效率 下 降 。 

5) 系统 由 一 个 主 处 理 机 加 上 和 者 干 从 处 理 机 组 成 ,硬件 和 软件 结构 相对 简单 ,但 灵活 


计 的 ， 


用 于 工作 负载 不 是 太 重 或 由 功能 相差 很 大 的 处 理 机 组 成 的 非 对 称 


系统 ， 


2. 独立 监督 式 操作 系统 
独立 监督 式 操作 系统 (Separate Supervisor) 与 主 从 式 操 作 系 统 不 同 , 在 这 种 类 型 中 ,每 
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一 个 处 理 机 均 有 各 上 自 的 管理 程序 (核心 )。 

独立 监督 式 操作 系统 有 以 下 特点 : 

(1) 每 个 处 理 机 将 按 日 号 的 需要 及 分 配给 它 的 任务 的 需要 来 执行 各 种 管理 功能 ,这 就 
是 所 博 的 独立 性 。 

(2) 由 于 有 好 几 个 处 理 机 在 执行 管理 程序 ,因此 管理 程序 的 代码 必须 是 可 重 人 的 ,或 者 
为 每 个 处 理 机 半 人 专用 的 管理 程序 副本 。 

(3) 因为 每 个 处 理 机 都 有 其 专用 的 管理 程序 , 故 访问 公用 表格 的 冲突 较 少 ,阻塞 情况 日 
然 也 就 较 少 ,系统 的 效率 就 高 。 但 冲突 仲裁 机 构 仍 然 是 需要 的 。 

(4) 每 个 处 理 相 对 独立 ,因此 一 台 处 理 机 出 现 故 障 不 会 引起 整个 系统 的 月 尝 。 但 是 ,要 
想 补救 故障 造成 的 损失 或 重新 执行 故障 机 未 完成 的 工作 则 非常 困难 。 

(5) 每 个 处 理 机 都 有 专用 的 IO 设备 和 文件 等 。 

(6) 独立 监督 式 操作 系统 要 实现 处 理 机 负载 平衡 更 加 困难 。 这 类 操作 系统 适合 于 松 耦 
合 多 处 理 机 体系 ,因为 每 个 处 理 机 均 有 一 个 局 部 存储 舌 用 来 存放 管理 程序 副本 ,存储 元 余 太 
多 ,利用 率 不 高 。 


3. 浮动 监督 式 操作 系统 


浮动 监督 式 操 作 系 统 (Floating Supervisor) 每 次 只 有 一 台 处 理 机 作为 执行 全 面 管理 功 
能 的 “ 主 处 理 机 ”, 但 根据 需要 , 主 处 理 机 是 可 浮动 的 , 即 从 一 台 切 换 到 男 一 台 处 理 机 。 这 是 
最 复 淋 、 最 有 效 、 最 灵活 的 一 种 多 人 处 理 机 操作 系统 ,适用 于 紧 硬 合 多 处理 机 体系 ,常用 于 对 称 
多 处 理 机 系统 中 。 

浮动 监督 式 操作 系统 有 以 下 特点 : 

(1) 每 次 只 有 一 人 台 处 理 机 作为 执行 全 面 管理 功能 的 “ 主 处 理 机 ”, 但 容许 者 
时 执行 同一 个 管理 服务 子 程序 。 因 此 ,多 数 管理 程序 代码 必须 是 可 重信 的 。 

(2) 根据 需要 ,“ 主 处 理 机 ”是 可 浮动 的 , 即 从 一 台 切 换 到 男 一 台 处 理 机 。 这 样 ,即使 执 
行 管 理 功能 的 主 处 理 机 故障 ,系统 也 能 照样 运行 下 去 。 

(3) 一 些 非 专 门 的 操作 (如 1O 中 断 ) 可 送 给 那些 在 特定 时 段 内 最 不 忙 的 处 理 机 去 执 
行 , 使 系统 的 负载 达到 较 好 的 平衡 。 

(4) 服务 请 求 冲 突 可 通过 优先 权 办 法 解决 ,对 共享 资源 的 访问 冲突 用 互 斥 的 方法 解决 。 

(5) 系统 内 的 处 理 机 采用 处 理 机 集合 概念 进行 管理 ,其 中 每 一 台 处 理 机 都 可 用 于 控制 
任 一 台 LO 设备 和 访问 任 一 存储 块 。 这 种 管理 方式 对 处 理 机 是 透明 的 ,并 且 有 很 高 的 可 靠 
性 和 相当 大 的 灵活 性 。 


8.3.4 多 处 理 机 的 并 行 性 实现 


多 处 理 机 主要 实现 作业 之 间 ,程序 段 之 间 , 任 务 之 间 的 并 行 ,也 可 包含 指令 级 ,指令 内 部 
各 微 操 作 之 间 的 并 行 。 

多 处 理 机 的 并 行 性 可 利用 并 行 算 总 
指令 硬件 等 多 种 途径 来 开发 和 实现 。 


台 处 理 机 同 


并 行程 序 设 计 霹 言 .并行 编译 、 并行 操 作 系统 以 及 
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1. 并 行 算法 、 并 行 语言 及 并 行 编 译 


1) 并 行 算法 

提高 并 行 处 理 效 率 的 关键 之 一 是 并 行 算 法 。 算 法 需 适 应 计算 机 的 结构 。 如 果 一 种 算法 
所 表达 出 来 的 并 行 度 与 计算 机 的 并 行 度 基 本 一 致 , 便 能 提高 计算 机 的 解 题 效 率 。 

一 般 算法 规定 了 求解 并 行 算法 则 是 指 可 同时 执 


某 一 特定 问题 时 的 有 和 穷 运算 处 理 步 又 。 
行 的 多 个 进程 的 集合 ,各 进程 可 相互 作用 、 协 调和 并 发 操作 。 

并 行 算 法 的 分 类 标准 不 同 则 绪 订 也 不 相同 。 

按 运 算 的 基本 对 象 可 分 为 数值 型 (基于 代数 运算 ) 和 非 数 值 型 (基于 关系 运算 ) 两 种 。 比 
如 ,矩阵 运算 、 线 性 方程 组 求解 等 均 为 由 型 的 数值 型 并 行 算 法 ; 非 数 值 型 并 行 算法 主要 是 对 
符号 操作 的 ,以 排序 .选择 .查找 .字符 处 理 的 并 行为 主要 代表 。 

按 并 行进 程 间 的 操作 顺序 的 不 同 又 可 分 为 同步 型 .异步 型 和 独立 型 三 种 。 同 步 型 并 行 
算法 意味 者 并 行 的 各 个 进程 间 由 于 相关 而 必须 依 友 等 每 ; 异步 型 并 行 算 法 则 是 各 个 进程 间 
相互 独立 ,没有 关联 ,无 须 因 关联 而 等 每 ,进程 的 中 止 或 继续 执行 取决 于 执行 情况 ; 独立 型 
并 行 算法 则 意味 着 各 个 进程 间 完 全 独立 ,进程 间 无 须 通 信 。 

按 计 算 任 务 的 大 小 还 可 以 分 为 细 粒 度 .中 粒度 和 粗 粒 度 三 种 。 细 粒度 并 行 算 法 的 典型 
代表 是 回 量 或 循环 级 的 并 行 ; 较 大 的 循环 级 并 行 一 般 就 属于 中 粒度 并 行 算 法 了 ; 粗 粒 度 并 
行 算法 一 般 指 子 任务 级 的 并 行 。 

猎 究 并 行 算法 的 一 种 思路 是 将 大 的 程序 分 解 成 一 定数 量 的 可 并 行 处 理 的 于 过 程 ( 可 以 
是 进程 任务 或 程序 段 ) ,其 直观 的 表现 形式 是 把 每 个 过 程 看 成 一 个 节点 ,将 过 程 之 间 的 关联 
用 证 点 组 成 的 树 来 摘 述 。 这 样 ,程序 内 各 过 程 之 间 的 关系 就 可 以 简单 地 当成 一 种 算术 表达 
式 中 各 项 之 间 的 运算 关系 来 处 理 了 ,表达 式 中 的 每 一 项 都 可 以 看 成 一 个 程序 段 的 运行 结 琳 。 
这 样 ,程序 段 之 则 的 并 行 性 问题 就 可 以 被 设想 成 是 对 算术 表达 式 如 何 进 行 并 行 运算 的 问 
磺 了 。 

为 了 评价 一 个 并 行 算法 性 能 到 拱 如 何 ,需要 定义 一 些 标准 。 用 了 表示 可 以 并 行 处 理 的 
处 理 机 的 数量 ; 用 T, 表示 单 台 处 理 机 顺序 运算 的 级 数 , 用 Tp 表示 P 台 人 处 理 机 运算 的 级 数 
( 树 的 高 度 ); 则 Sp (此 处 指 多 处 理 机 的 加 速 比 ) 就 表示 荆 与 Tp 之 比 ; 用 Ep 表示 P 台 人 处 理 
机 的 设备 利用 率 (使 用 效率 ) ,Ep 二 Sp/P。 

下 面 我 们 用 一 个 例子 来 说 明 不 同 的 并 行 算 法 对 计算 机 性 能 的 影响 。 

【 例 8.1】 有 一 个 算术 表达 式 相 一 CC 十 D， 7 二 cc 和 十 & Xx , 试 分 析 算 法 对 树 高 的 

解 : 单 处 理 机 上 的 执行 一 般 会 利用 堆 纳 (Horner) 法 进行 变换 ,得 到 等 价 式 为 Fj 二 
XT(b 十 XT(c 十 XT(Qd))), 这 是 一 个 典型 的 循环 算法 , 需 3 个 滋 加 循环 ,6 级 运算 , 即 P= 二 1,T 王 6， 
适合 于 单 处 理 机 ,用 树 状 流程 图 表示 ,结果 如 图 8-21(a) 所 示 。 

但 是 ,这 样 的 变换 并 不 适合 在 多 处理 机 上 并 行 运 行 ,因为 这 3 个 乘 加 循环 之 间 产 生 了 关 
联 ,无 法 并 行 。 还 不 如 用 原来 的 式 子 在 多 处 理 机 上 下 接 求 解 更 有 效 , 此 时 P=3,Tbp 二 4， 

二 3/2,Ep 二 1/2。 如 图 8-21(b) 所 示 , 两 者 比较 ,加 速 比 Sp 二 3/2, 但 Ep 二 1/2, 这 就 是 说 
运算 的 加 速 总 是 伴随 看 效率 的 下 降 。 

既然 把 运算 过 程 表示 成 了 树 , 树 的 高 度 又 代表 看 运算 的 级 数 ,那么 提高 运算 的 并 行 度 
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(b) 
图 8-21 算法 对 树 高 产生 影 啊 的 树 状 流程 图 


题 就 变 成 了 如 何 对 树 进 行 变换 ,来 降低 树 的 高 度 ,以 减少 运算 级 数 的 问题 卫 。 那 么 如 何 对 树 
进行 楼 换 呢 ? 

树 状 结构 可 以 用 结合 律 、 交 换 律 和 分 配 律 来 变换 树 的 形状 。 对 树 状 结构 进行 变换 的 过 
程 是 : 首先 利用 交换 律 把 相同 的 运算 集中 在 一 起 。 然 后 利用 结合 律 把 参加 这 些 运 算 的 操作 
数 配 对 , 尽 可 能 并 行 运 算 , 从 而 组 成 树 局 最 小 的 子 树 。 最 后 绸 把 这 些 子 树 结 合 起 来 ,用 分 配 
律 进一步 降低 树 高 。 

来 用 多 处 理 机 的 目的 就 是 要 提高 速度 ,这 同时 要 求 尽 可 能 把 任务 分 化 成 更 多 可 并 行 执 
行 的 过 程 。 上 面 已 经 把 任务 并 行 化 设想 成 是 运算 并 行 性 问题 ,并 用 树 表 示 了。 那么 对 树 而 
言 , 就 是 要 尽 可 能 增 大 树 每 一 层 的 方 点 数 , 即 增 大 树 的 广度 ,这 样 就 可 以 使 各 人 处理 机 可 并 行 
的 过 程 数 尽 可 能 增 大 , 树 的 融 度 就 降低 了 ,也 就 是 处 理 机 运算 的 级 数 也 降低 了 。 一 句 话 , 束 
是 当 最 大 限度 地 降低 了 树 的 高 度 之 后 ,在 这 个 基础 上 再 缩小 树 的 广度 ,目的 就 是 在 达到 一 定 
的 加 速 比 之 后 ,再 通过 减少 处 理 机 数量 已 降低 来 多 处 理 机 的 效率 。 

【 例 8.2〗 有 一 个 表达 式 为 下 一 罗 十 Dec 十 DO， de。 丰 pg 十 1 分析 求 解 其 并 行 
解 : 通 第 可 以 从 算术 表达 陈 本 身 出 发 ,利用 交换 律 把 相同 的 运算 集中 在 一 起 ,然后 再 利 
娃 把 参加 运算 的 操作 数 配 对 , 尽 可 能 并 行 运算 ,从 而 组 成 树 高 最 小 的 子 树 ,再 把 这 些 


i 


用 


需 7 级 运算 ; 利用 交换 律 和 结合 律 可 改写 成 Fs 二 (mx 十 n) 十 b((c 十 g) 十 d，e*， 内, 此 时 P= 
2 ,只 需 5 级 运算 即 可 。 且 Sp 二 7/5,Ep 一 0.7。 

进一步 分 析 发 现 用 分 配 律 还 可 以 降低 树 高 ,只 要 恰当 地 平衡 好 各 了 于 树 的 级 数 就 第 第 能 
收 到 很 好 的 效 采 。 

于 是 F, 表达 式 进一步 被 转换 成 fF, 一 (m 十 0) 十 (6 cb6*g) 二 bd，e*，f, 从 而 ,P= 
3,，,Tp 二 4,Sp 二 7/4,Ep= 二 7/12。 需 5 级 运算 ,Sp 提高 了 ,但 效率 下 降 了 。 

2) 并 行 语言 和 并 行 编 详 

并 行 算法 需要 用 并 行程 序 来 实现 。 如 何在 程序 中 识别 和 表示 并 发 进程 部 分 呢 ?这 就 需 
要 在 程序 中 加 入 能 明确 表示 并 发 进程 的 语义 表示 方法 ,而 这 就 是 下 和 面 要 讨论 的 并 行 语言 。 

表达 式 运算 并 行 性 的 识别 和 实现 , 除 依靠 并 行 算法 还 可 以 依靠 编译 程序 ,可 以 经 过 或 不 
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过 逆 波 兰 后 组 表达 式 产 生 并 行 指 令 。 
例如 ,算术 表达 式 Z= 二 M 十 A x Bx C/D 十 N ,利用 串 行 编译 算法 ,产生 三 元 指令 组 为 


二 十 来 来 
tn 心 上 m 


mn Wi bb 
口中 


指令 之 间 都 是 相关 的 , 需 5 级 运算 。 但 如 果 利 用 并 行 编译 算法 ,其 三 元 指令 组 为 


上 十 十 来 ~ 水 
中 计时 名 


- 性 
np NN m 


两 个 处 理 机 并 行 处 理 的 话 , 则 三 级 运算 就 够 了 。 

根据 这 个 并 行 编译 的 结果 ,可 以 很 容易 地 得 到 以 下 程序 : 

5 CC= 有 关口 

局 > H= CD 

53 I=G+H 

S，J=M+N 

SS 2 三 T+yJ 

如 果 不 加 并 行 控 制 语句 ,这 个 程 夺 仍然 只 是 一 个 普通 的 串 行程 序 。 现 在 就 来 给 这 个 程 
夺 加 入 块 控制 结构 式 语言 ,该 语言 由 下 . W. Dijkstra 提出 ,在 该 语言 中 ,把 所 有 可 并 行 执行 的 
语句 或 进程 用 Cobegin-Coend 或 parbegin-parend 括 住 ,以 示 区 别 于 其 他 品行 执行 的 语句 或 

Cobegin-Coend 或 parbegin-parend 成 对 使 用 ,主要 用 于 描述 多 程序 多 数据 的 并 行 , 并 
行 的 各 进程 同时 开始 ,但 它们 相互 独立 ,不 相关 ,它们 也 并 不 一 定 同 时 结束 , 仅 当 所 有 并 发 进 
程 完 成 时 才 终 止 并 行 。 

其 一 般 形式 为 


Begin 

So; 

Cobegin SO; Bo: … 5 Coend 
= 1 fF 


end 


= 


Begin 

oo ; 

parbegin Si ; Ba; …; Sn; parend 
On+l; 


end 
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于 是 ,算术 表达 式 Z= MTAx*BxC/DT+N 对 应 的 并 行 控 制程 序 如 下 ， 


Begin 

Cobegin SS Coend 
D3 

Ds 


end 
2. 程序 的 并 行 性 


在 多 处 理 机 系统 中 ,提高 程序 并 行 性 的 关键 ,是 把 任务 分 解 成 足够 多 的 可 同时 操作 的 进 

程 。 在 程序 语言 中 ,还 须 扩 充 能 明确 表达 进程 并 发 性 的 语句 ,以 便 程序 运行 时 能 为 相应 的 控 

制 机 构 提 供 控 制 和 管理 手段 ,其 中 包括 并 行 任 务 的 派生 、 通 信和 和 调度。ADA 语言 为 描述 多 

en 千 构 提供 了 必要 的 二 名 。 为 适应 数据 流 计算 机 而 出 现 的 右 干 数据 流 二 言 如 

d 语言 和 VAL 语言 也 已 经 在 试用 ,其 重要 特点 是 把 数组 看 成 从 而 不 是 目标 。 用 数据 流 语 
wire 最 大 的 运算 并 行 性 。 


8.4 机 群 系统 


机 群 系统 是 近 些 年 来 出 现 的 一 种 并 行 处 理 拉 术 , 它 利用 高 速 网 络 将 一 些 独立 的 机 货 系 
统 以 松 奏 合 方式 连接 起 来 ,构成 一 个 大 小 规模 可 随 应 用 的 需要 而 变化 的 集群 系统 。 本 世 赴 
先 介 绍 机 群 的 概念 ,然后 介绍 机 群 系统 的 组 成 及 相关 技术 ,最 后 举 一 个 机 群 的 应 用 实例 。 


8.4.1 机 群 系统 的 定义 


随 看 向 处 理 硕 性 能 的 不 断 提 高 和 高 速 网 络 技术 的 发 展 , 传 统 的 松散 耘 合 系统 的 通信 撼 
宽 逐 步 得 到 了 缓解 ; 同时 并 行 编程 环境 的 开发 使 得 新 编 并 行程 序 或 改写 串 行 程序 变 得 更 为 
容易 。 这 一 切 都 导致 一 种 新 的 并 行 处 理 系 统一 一 机 群 系统 得 以 发 展 起 来 ,并 成 为 当前 并 行 
人 处理 技术 新 的 发 展 方 同 。 
所 谓 机 群 系统 (Cluster) 是 指 一 组 完整 的 计算 机 互 连 , 它 们 作为 一 个 统一 的 计算 机 资源 
一 起 工作 ， 并 能 产生 一 台 机 妖 的 印象 。 术 语 “ 完 整 计算 机 ”, 意 指 一 台 计 算 机 离开 机 群 系统 仍 
行 日 己 的 任务 ,机 群 系统 中 每 台 计 算 机 一 般 称 为 厄 点 。 
”根据 定义 ， 机 群 是 一 组 独立 的 计算 机 节点 的 集合 体 , 但 机 群 对 用 户 和 应 用 来 说 只 是 一 个 
单一 的 系统 ,节点 间 通 过 高 性 能 的 互联 网 络 连 接 。 各 节点 除了 可 以 作为 一 个 单一 的 计算 资 
源 供 交 互 式 用 户 使 用 外 ,还 可 以 协同 工作 并 表现 为 一 个 单一 的 、 集 中 的 计算 资源 供 并 行 计算 
任务 使 用 。 
一 般 来 讲 , 机 群 系统 中 主要 包括 下 列 组 件 : 
(1) 高 性 能 的 计算 节点 机 。 机 群 的 节点 可 以 是 一 个 工作 站 ,或 者 是 一 台 个 人 计算 机 ,但 
也 可 以 是 一 人 台 规 模 相 当 大 的 对 称 多 处 理 机 (CSMP) 。 
(2) 高 速 交 换 网 络 。 节 点 间 的 互 连 可 以 通过 普通 的 商用 网 络 ( 如 以 太 网 .EDDI、ATM 
等 ) 和 使 用 标准 的 网 络 通信 协议 ,也 可 以 使 用 专门 设计 的 网 络 。 
(3) 具有 较 强 网 络 功能 的 操作 系统 。 
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(4) 机 和 群 中 间 件 。 支 持 分 布 共 至 存储 右 及 为 用 户 提 供 单 
软件 等 。 

(5) 并 行程 序 设 计 环 境 与 工具 ,如 编译 央 、. 语 言 环境 .并 行 虚拟 机 (PVM) 和 消息 传递 接 
口 (MPDI) 等 

(6) 应 用 ,包括 串 行 和 并 行 应 用 程序 。 

机 群 系 统 提出 之 后 发 展 得 十 分 迅猛 ,已 成 为 目前 人 研究 的 热点 。 机 群 受 到 广泛 关注 的 原 
因 是 多 方面 的 ,其 中 之 一 就 是 它 可 以 用 商品 处 理 器 和 商品 网 络 方便 地 构造 。 另 外 它 还 有 许 
多 过 去 的 并 行 系统 不 可 比拟 的 优势 ,主要 体现 在 以 下 几 个 方面 : 

(1) 投资 风险 小 。 传 统 的 大 规模 并 行 处 理 机 比较 昂贵 ,如 果 性 能 不 好 就 等 于 浪费 了 大 
量 和 资金 。 而 机 和 群 即 使 作为 并 行 系统 效果 不 好 , 它 的 每 个 市 点 仍 可 以 作为 高 性 能 微机 使 用 ,不 
会 当 费 资金 。 

(2) 性 能 价格 比 高 。 传 统 的 并 行 机 由 于 生产 批量 小 往往 价格 昂 贯 。 机 群 的 节点 和 互联 
网 络 等 可 以 使 用 商品 化 的 计算 机 产品 ,无 须 专门 单独 设计 和 制造 ,这 可 以 大 大 降低 成 本 ， 
而 机 群 的 性 能 价格 比 好 。 在 相同 的 性 能 峰值 情况 下 ,机群 的 价格 比 传统 的 多 人 处理 机 系统 可 
以 低 1 到 2 个 数量 级 。 

(3) 可 用 性 好 。 一 方面 系统 的 开发 周期 短 ,机 群 的 硬件 都 是 商用 的 ,开发 的 重点 在 通信 
机 制 和 并 行 编程 环境 上 ; 男 一 方面 编程 方便 ,软件 继承 性 好 。 在 机 群 系 统 中 用 户 无 须 学 习 
新 的 并 行程 序 设计 语言 。 只 需 在 常规 的 C.C++、FORTRAN 串 行 程序 中 插入 少量 通信 原 
语 , 即 可 使 其 在 机 和 群 上 运行 。 

(4) 可 靠 性 高 。 机 群 中 有 多 个 存储 器 、 处 理 机 和 磁盘 部 件 , 有 一 个 部 件 出 现 故 障 , 其 他 
部 件 仍 能 使 用 ,从 而 保证 机 群 能 继续 工作 。 机 群 中 每 个 节点 都 有 自己 的 操作 系统 ,一 个 操作 
系统 骨 演 了 ,其 他 节点 仍 能 工作 。 这 一 点 显然 比 SMP 好 ,因为 SMP 的 存储 天 如 有 故障 ,将 
会 使 整个 系统 不 能 工作 。SMP 只 有 一 奉 操 作 系 统 驻 留 在 共 至 存储 问 中 ,操作 系统 朋 沉 , 整 
个 系统 也 不 能 工作 。 

(5) 可 扩展 性 好 。 机 群 的 计算 能 力 能 随 节 点 的 增加 而 增加 。 机 群 中 的 处 理 机 、 存 储 人 前、 
磁盘 ,甚至 IO 设备 部 可 增 减 。 由 于 市 点 加 是 松 粳 合 的 ,机 群 的 节点 数 有 可 能 增加 到 几 百 
个 ,而 SMP 只 能 增 减 处 理 机 ,处 理 机 数 最 多 也 只 能 有 几 十 个 ,因为 SMP 是 紧 耦 合 的 ,存储 
器 会 成 为 系统 的 瓶颈 。 

(6) 系统 结构 灵活 。 不 同 结构 ,不 同性 能 ,不 同 操作 系统 的 工作 站 都 可 以 连接 起 来 构成 
机 群 系统 。 这 样 用 户 就 可 以 充分 利用 现 有 的 设备 以 及 闲散 的 计算 机 ,用 少量 投资 获得 较 大 
的 计算 能 力 。 

但 机 群 也 有 不 足 之 处 。 由 于 机 群 是 由 多 人 台 完 整 的 计算 机 组 成 的 ,因而 它 的 维护 工作 量 
和 忱 用 较 融 , 它 相 当 于 要 同时 去 管理 多 个 计算 机 系统 。SMP 则 显得 比 机 群 好 ,因为 对 于 
SMP ,管理 员 要 维护 的 只 是 一 个 计算 机 系统 。 正 因为 如 此 ,现在 很 多 机 群 采用 SMP 作为 节 
点 ,这样 可 以 减少 节点 数 , 也 就 减少 了 维护 工作 量 和 开支 。 


8.4.2 机 和 群 系统 的 组 成 


如 图 8-22 所 示 是 一 个 典型 的 机 群 系统 的 组 成 结构 图 。 前 先 , 在 便 件 的 组 成 上 ,各 个 市 
扩 (PC 或 工作 站 ) 通 过 高 速 网 络 或 硬件 开关 互 连 ; 其 次 ,每 个 独立 的 厄 点 计算 机 部 有 日 己 的 


一 系统 映像 的 资源 定理 和 调 刻 
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控 作 系统 用 于 完成 网 络 通信 ,并 安家 有 中 间 件 (Middleware) 以 允许 机 群 操 
群 系统 提供 的 并 行程 序 设 计 环 境 为 并 行 应 用 程序 提供 运行 环境 。 


并 行 应 用 程序 


并 行程 序 设计 环境 


机 群 系统 中 间作 


(单一 系统 映像 和 高 可 用 性 软件 ) 


PC/ 工 作 站 PC/ 工 作 站 PC/ 工 作 站 PC/ 工 作 让 


网 络 接口 网 络 接 口 


高 速 网 络 


8-22 机群 系统 组 成 结构 图 


机 和 群 中 的 中 间 件 能 提供 以 下 的 功能 。 

(1) 单一 和 人口 点 : 用 户 通过 单一 人口 登录 到 机 群 上 而 不 是 个 别 的 计算 机 上 。 

(2) 单一 文件 层次 : 用 户 看 到 的 是 同一 根 目 录 下 的 单一 文件 目录 系统 。 

(3) 单一 控制 点 : 系统 使 用 一 人 台 和 默认 的 机 天 用 于 整个 机 群 的 管理 和 控制 。 

(4) 单一 存储 空间 : 机 群 为 用 户 程序 提供 的 是 统一 的 共享 存储 髓 ,虽然 共享 存 健 
以 分 布 在 各 个 节点 中 ,但 对 用 户 程 序 而 言 ,它们 所 看 到 的 是 一 个 统一 的 虚拟 存储 空间 。 

(5) 单一 作业 管理 系统 : 在 机 群 作 业 调 度 程序 管理 下 ,用 户 提 交 作 业 无 须 指 定 执 行 此 
作业 的 宿主 计算 机 ，。 

(6) 单一 用 户 接 口 : 机 和 群 使 用 一 个 统一 的 公共 图 形 接口 支持 所 有 用 户 , 不 管用 户 从 哪 
台 机 天 登录 系统 。 

(7) 单一 LO 空间 : 任 一 契 扣 部 能 访问 系统 中 有 所 有 的 /0 设备 或 磁盘 系统 ,而 无 须知 

在 系统 中 的 具体 位 置 。 

(8) 进程 迁移 : 这 一 功能 可 以 使 系统 负载 均衡 。 


8.4.3 机 群 系统 中 的 关键 技术 


机 群 系统 中 的 关键 技术 主要 包括 通信 技术 、 并 行程 序 设计 环境 .单一 系统 映像 (Single 
System Image,SSIT) 等 。 

随 着 商品 处 理 器 性 能 的 不 断 提高 ,机 和 群 各 节点 的 处 理 速度 已 相当 高 ,制约 机 群 性 能 的 主 
要 因素 是 节点 间 的 通信 速度 。 如 果 通 信 速 度 跟 不 上 ,各 节点 的 处 理 能 力 就 发 挥 不 出 来 。 提 
高 通信 速度 目前 从 硬件、 软件 方面 都 采取 了 措施 ， 

硬件 方面 是 尽量 使 用 高 速 网 络 ,如 快速 以 太 网 .ATM 、Myrinet(Myricom 公司 从 1994 年 就 


ge 


开始 销售 其 第 一 代 Myrinet 产品 ,当时 只 是 作为 以 太 网 络 的 第 二 选择 来 实现 机 群 系统 中 的 
方 点 互 连 ,除了 100MB/s 的 高 市 宽 外 , 它 的 主要 优势 是 小 数据 量 延 时 ,只 有 10 一 15ms, 这 与 
当时 Convex、IBM.、SGI 等 公司 在 并 行 系统 中 使 用 的 专 有 网 络 的 高 延 开 形成 鲜明 对 比 。 此 
后 随 着 软 硬 件 的 不 断 升 级 ,Myrinet 更 是 成 为 了 机 和 群 制造 商 的 第 一 选择 ) 等 。 它 们 的 理 宽 已 
达 Gb/s 数量 级 。 

在 软件 方面 ,提高 网 络 传输 速度 的 主要 措施 是 努力 减 小 通信 在 软件 方面 的 开销 ,包括 精 
简 通 信 协 议 ,设计 新 的 通信 机 制 等 。 传 统 的 TCP/IP 协议 是 面向 低速 率 、 高 差错 和 大 数据 包 
符 禾 测 寺 二 灼 : 克 法术 让 村 二 相生 尖 栋 直 机 克 尖 间 关 不 杠 村: TCP/IP 协议 有 很 多 层次 , 数 
据 传 输 时 需要 反复 拷贝 ,市 来 了 很 大 的 时 延 。 万 一 方面 ,各 层 中 有 许多 重复 的 操作 ,在 机 和 群 
环境 中 这 些 操作 是 不 必要 的 。 所 以 ,通过 修改 .精简 协议 可 以 降低 通信 开销 。 例 如 ,为 了 提 
高 传输 速度 ,UC Berkeley 开发 了 一 种 名 为 Active Message 的 通信 机 制 。 这 种 通信 机 制 的 
思想 是 消息 本 映 这 有 消息 处 理 程 序 的 地 址 和 参数 。 消 息 到 达 目 的 节点 后 系统 立即 产生 中 上 断 
调用 ,并 巾 中断 处 理 机 制 局 动 消 息 处 理 程序 。 消 息 处 理 程 序 从 网 卡 上 取出 消息 并 给 发 送 方 
发 送 一 个 应 答 消 息 ,然后 返回 原来 被 中 断 的 程序 。Active Message 是 一 种 消息 驱动 的 异步 
通信 方式 ,能 更 好 地 实现 通信 与 计算 的 重 登 。 

为 了 便于 用 户 使 用 ,机 群 系统 必须 给 用 户 提 供 一 个 方便 多 用 的 并 行程 序 设 计 环 境 。 目 
前 机 群 系统 上 广泛 使 用 的 并 行程 序 设计 环境 有 PVM、MPI、Express(1982 年 ,Caltech 的 一 
个 Hypercube 人 饶 究 小 组 着 手 开 发 世界 上 第 一 台 实 用 并 行 机 系统 CosmicCube; 稍 后 ， 这 个 小 
组 开始 人 研制 相应 的 软件 开发 工具 Crystalline OS CrOS, 此 即 为 Express 的 原型 )、P4 等 。 
它们 都 是 基于 消息 传递 方式 的 。 其 中 PVM 和 MPI 应 用 得 最 多 。PVM (Parallel Virtual 
Machine) 是 美国 橡树 岭 国 家 实验 室 及 美国 几 所 大 学 联合 开发 的 并 行 计算 工具 软件 ,支持 C、 
C++ 和 FORTRAN。MPI(Message Passing Interface) 是 一 个 消息 传递 标准 ,是 由 MPI 委员 
会 在 1992 年 11 月 至 1994 年 1 月 举行 的 一 系列 会 议 上 逐渐 产生 的 , 它 的 设计 非常 审慎 , 博 
采 众 长 。PVM 和 MPI 部 是 免费 软件 ,它们 都 可 以 方便 地 进行 再 开发 。 

单一 系统 映像 (SST) 的 目的 是 将 整个 机 群 系统 虚拟 为 一 个 统一 的 系统 ,使 用 户 感 觉 不 到 
各 工作 站 的 存在 ,而 好 像 就 在 使 用 一 台 普 通 的 计算 机 。SSI 的 作用 是 使 分 散 的 资源 看 起 来 
是 一 个 统一 的 更 强大 的 资源 。 在 机 群 系统 中 ,SSI 可 以 用 硬件 实现 也 可 以 用 软件 实现 。 用 
软件 实现 时 ,是 通过 中 间 件 来 实现 的 。 中 间 件 是 介 于 操作 系统 和 用 户 层 之 间 的 一 层 软 件 。 
中 辐 件 与 操作 系统 联系 在 一 起 ,支持 SSI 通信、 并 行 度 .负载 平衡 等 ,在 所 有 的 市 点 上 提供 
对 系统 资源 的 统一 访问 。 

机 群 系统 中 还 有 一 些 其 他 的 重要 技术 ,例如 ,全 局 资源 的 利用 。 效 据 表 明 , 由 于 网 络 速 
度 的 提 融 , 方 点 访问 其 他 节点 的 内 存 要 比 访问 本 地 便 盘 快 。 因 此 有 效 地 利用 整个 系统 的 内 
存 减 少 使 用 磁盘 可 以 提高 计算 速度 。 这 提出 了 一 个 如 何 有 效 地 利用 全 局 资源 的 问题 。 又 如 
负载 平衡 问题 ,尤其 在 寞 构 机 群 中 ,评价 各 广 点 的 计算 能 力 以 及 进程 迁移 部 很 困难 。 

需求 推动 拉 术 的 发 展 , 从 工业 标准 机 群 渐 成 主流 这 一 事实 ,机 群 就 已 经 同人 们 展示 了 人 它 
织 大 的 生命 力 。 


8.4.4 ”机群 系统 举例 
IBM SP2 是 用 机 群 方法 构成 的 专用 机 群 系统 ,是 机 群 中 有 代表 性 的 产品 , 它 既 可 进行 
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科学 运算 ,也 可 供 商业 应 用 。1997 年 战胜 世界 国际 象棋 和 冠 军 卡 斯 帕 洛 夫 的 “深蓝 ”, 就 是 一 
个 采用 30 个 IBM RS/6000 工作 站 节点 ( 带 有 专门 设计 的 480 片 国际 象棋 芯片 ) 的 IBM SP2 


结构 ,如 图 8-23 所 示 。 


SP2 机 群 采 用 的 是 一 种 分 布 式 存储 硕 MIMD 体系 


高 性 能 开关 HPS 


P 一 处 理 戎 ，M 一 和 仓 备 年 : D 一 磁 弄 : MCC 一 逢 通 壹 控制 前 
E 一 以 六 了 网 适 配 兰 : NIC 一 网 络 接口 开 天 


图 8-23 ”IBM SP2 结构 


其 中 ,SP2 的 每 个 节点 是 一 台 RS/6000 工作 站 ,这 有 目 己 的 存储 名和 本 地 磁盘 。 每 个 
斑点 配 有 一 套 完 整 的 AIX 操作 系统 (IBM 的 类 UNIX 操作 系统 ) ,节点 间 的 互联 网 络 接口 
是 松 耘 合 的 ,通过 节点 本 身 的 IO 微 通 道 连接 到 网 络 上 。 交 点 的 硬件 和 软件 都 能 按 不 同 用 
户 的 应 用 和 环境 的 需要 个 别 地 进行 配置 。 

SP2 的 节点 数 可 以 为 2 一 512 个 。 每 个 节点 采用 RS/6000 工作 站 外 ,整个 SP2 系 
统 还 男 外 配置 了 一 台 RS/6000 工作 站 作为 系统 探 制 台 之 用 。 市 点 间 使 用 了 两 个 网 络 进 行 
互联 ,一 个 是 标准 的 以 太 网 , 另 一 个 是 专门 设计 的 高 性 能 开关 HPS( 一 种 Omega 多 级 开关 
网 络 )。 以 太 网 可 以 用 于 对 通信 速度 要 求 不 高 的 程序 开发 工作 ,开发 好 的 程序 在 正式 运行 时 
用 HPS。 以 太 网 还 有 备份 的 作用 , 当 HPS 有 故障 时 可 以 通过 以 太 网 使 系统 维持 工作 。 以 
太 网 还 可 以 供 系 统 的 监视 . 引导、 加载 .测试 和 其 他 系统 管理 用 。 

从 图 8-23 中 可 以 看 到 每 个 厄 点 有 独 用 的 存储 角 和 本 地 的 伐 盘 ,各 个 万 点 通过 微 通 道 探 
制 各 (MCC) 的 IO 总 线 与 外 部 网 络 连接 ,其 中 通过 以 太 网 适 配 天 (下 ) 连 接 到 以 太 网 上 ,通过 
网 络 接口 开关 (CNIC) 连 接 到 HPS。NIC 又 称 为 开关 适 配 血 , 它 有 一 个 8MB 的 DRAM 用 来 
存放 各 种 不 同 协议 所 需 的 大 量 报 文 ,并 用 一 台 1860 微 处 理 机 进行 控制 。 在 SP2 系统 中 , 除 
HPS 外 ,有 的 还 采用 光纤 分 布 式 数据 接口 (FDDITD) 环 连接 各 节点 。 微 通道 是 IBM 公司 的 标 
准 I/O 总 线 , 用 于 把 外 部 设备 连接 到 RS/6000 工作 站 和 IBM PC 上 。 

SP2 的 1/O 子 系统 的 结构 如 图 8-24 所 示 。SP2 的 1/O 系统 基本 上 是 围绕 着 HPS 建立 
的 ,并 可 以 用 一 个 LAN 网 关 同 SP2 系统 外 的 其 他 计算 机 连接 。SP2 的 节点 可 以 有 4 种 配 
置 。 它 们 是 和 宿主 节点 ,I/O 节点 、 网 关节 点 和 计算 节点 。 衍 主 节 点 用 来 处 理 各 种 用 户 注 册 会 
话 和 进行 交互 处 理 ; 1/O 节点 主要 用 来 实现 1/O 功能 ,如 作为 全 局 文件 服务 器 。 网 关节 点 
用 于 连 网 功能 ; 计算 廊 点 专 供 计 算 。 这 4 种 方 点 也 可 能 有 重合 ,例如 一 个 答 主 三 点 也 可 以 
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作为 计算 廊 点 ,一 个 1/O 六 点 也 可 以 作为 网 天 广 点 。 此 外 ,SP2 还 可 以 有 一 台 到 几 台 外 部 服 
务 骨 ,它们 是 在 SP2 之 外 附加 的 其 他 机 天 ,如 可 以 附加 文件 服务 需 等 。 


i 于 二。 上 
. 


高 性 能 开关 HPS 


C 一 计算 节点 ; HH 一 宿主 节点 ; 6G 一 网 关节 点 
MD 一 LO 节点 ; S$ 一 外 部 主机 或 服务 器 


8-24 SP2 I/O 〇 子 系 统 结 构 


SP2 系统 软件 的 核心 是 AIX 操作 系统 。SP2 系统 中 ,在 RS/6000 工作 站 原 有 环境 下 开 

的 软件 大 部 分 部 能 重用 ,包括 各 种 串 行 的 应 用 程序 、 数 据 库 管理 系统 (DB2)、 连 机 事务 处 
理 监 控 程 序 .系统 管理 和 作业 管理 软件 FEORTRAN C++ 编译 程序 及 标准 的 AIX 操作 系统 
等 。SP2 系统 只 需 汶 加 一 些 作 为 一 个 可 缩放 的 并 行 系统 所 需 的 新 软件 ,或 者 对 现成 的 软件 
做 一 些 改进 。 

SP2 有 一 个 集中 的 系统 控制 台 用 以 管理 整个 系统 。 系 统 控制 台 用 的 是 一 人 台 控 制 用 的 工 
作 站 , 它 可 以 使 系统 管理 人 员 从 单一 地 点 对 整个 SP2 系统 进行 管理 。 此 外 ,在 SP2 硬件 中 ， 
每 个 慷 点 ,每 个 开关 和 每 个 机 架 都 有 一 个 监视 板 , 这 种 监视 板 能 对 环境 条 件 进 行 检 测 , 并 对 
人 硬件 部 件 进行 控制 。 管 理 人 员 可 以 用 这 套 设 施 来 启动 和 切断 电源 ,进行 监控 ,把 单个 节点 和 
开关 部 件 置 为 初始 状态 。 


多 核 处 理 融 以 其 高 性 能 、 低 功 耗 优 势 正 逐步 取代 传统 的 单 处理 融 成 为 市 场 的 主流 。 本 
节 介 绍 多 核 处 理 器 产生 的 背景 ,Hydra .Cell、RAW 这 三 种 典型 的 多 核 处 理 器 结构 ,重点 讨 
论 核 心 结构 选择 .存储 结构 设计 .片上 通信 、 低 功 耗 、. 软 件 应 用 开发 6 个 影 啊 当 前 多 核 处 理 融 
发 展 的 关键 技术 ,最 后 展望 多 核 处 理 表 的 未 来 发 展 趋势 。 


8.5.1 多 核 处 理 器 产生 的 背景 


随 着 微 电 子 技术 的 发 展 ,现代 计算 机 的 核心 部 件 一 一 中 央 处 理 器 (CPU) 的 晶体 管 数目 
和 速度 一 直 按 照 摩尔 定律 发 展 。 过 去 三 十 多 年 里 ,CPU 设计 者 主要 通过 提高 时 钟 速度 、 优 
化 指令 执行 和 增 大 上 请 内 高 速 缓 存 三 个 方面 来 提高 CPU 性 能 。 

利 先 ,提高 时 钟 速度 就 是 提升 CPU 工作 的 节 提 ,让 CPU 跑 得 更 快 ,也 就 意味 者 让 同样 
的 工作 能 够 在 更 短 的 时 间 里 完成 。 其 次 是 优化 指令 执行 效率 ,尽量 在 同样 的 时 间 内 完成 更 
多 工作 ,现代 CPU 设计 中 ,一些 指 令 的 执行 被 不 同 程度 地 做 了 优化 ,如 流水 线 设计 、 分 文 预 
测 、 同 一 时 钟 周期 内 执行 更 多 指令 ,其 至 指令 流 再 排序 支持 乱 序 执行 等 。 第 三 个 是 增 大 片 内 
高 速 缓存 ( 即 cache) ,由 于 内 存 一 直 比 CPU 慢 很 多 ,因此 让 数据 尽 可 能 靠近 CPU ,最 好 就 是 
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百 接 放 在 CPU 片 内 了 ,因此 ,上 乒 内 缓存 容 量 持续 冕 升 了 很 多 年 。 

然而 ,CPU 频率 越 高 ,所 需 电 能 和 发 热量 也 越 多 ; 制造 工艺 的 进步 ,让 品 体 管 更 小 , 虽 
然 耗 电 和 发 热量 可 能 减少 ,但 是 造成 了 严重 的 电流 泄漏 问题 , 随 之 市 来 的 就 是 大 量 的 电能 消 
耗 和 上 废 热 。 人 允许 并 行 执 行 的 典型 指令 流 存 在 一 定 的 数量 限制 ; 在 大 多 数 应 用 情形 下 ,超标 
量 CPU 同时 并 发 4 条 以 上 指令 时 只 能 使 性 能 增加 一 点 点 。 为 外 ,增加 更 多 的 管线 寄存 冀 以 
及 一 些 劳 路 复 用 开关 ,并 且 防 止 流水 线 善 错 导 致 的 性 能 损失 ,在 电路 上 所 能 够 增加 的 措施 已 
经 快 到 极限 了 。 

由 于 实际 散热 限制 出 现 的 “ 功 耗 墙 ”, 超 标量 发 射 的 指令 并 行 机 制 以 及 实际 流水 线 长 度 
的 限制 ,使 CPU 在 传统 的 架构 上 按摩 尔 定律 来 进一步 提升 性 能 对 CPU 设计 者 而 言 已 经 越 
来 越 难 了 。 这 种 限制 导致 主要 的 CPU 生产 厂家 如 Intel 等 调整 了 它们 的 策略 ,不 再 是 仅仅 
关注 单 CPU Core 的 时 钟 速率 与 处 理性 能 。 

CPU 设计 者 必须 找到 新 的 办 法 有 效 地 提升 品 体 管 数量 ,同时 又 降低 功 耗 和 设计 复杂 
性 。 一 个 可 行 的 办 法 是 CMP(Chip Multi-Processor ) 多 核 CPU 架构 , 即 一 颗 让 片 内 集 
成 多 个 处 理 表 核 。 


8.5.2 多 核 处 理 帝 结构 


多 核 处 理 责 也 称 为 片上 多 处 理 需 (CChip Multi-Processor,CMP) ,或 单 世 片 和 多 处 理 需 。 
和 月 1996 年 美国 斯 坦 福 大 学 首次 提出 片上 多 处 理 带 CCMP) 思 想 和 首 个 多 核 结 构 原 型 ,到 
2001 年 IBM 推出 第 一 个 商用 多 核 处 理 般 POWER4, 再 到 2005 年 Intel 和 AMD 多 核 处 理 
做 的 大 规模 应 用 ,最 后 到 现在 多 核 成 为 市 场 主流 ,多 核 处 理 融 经 历 了 十 几 年 的 发 展 。 在 这 个 
过 程 中 ,多 核 处 理 胡 的 应 用 范围 已 柳 兽 了 多 妹 体 计算 .能 人 二 设备 .个 人 计算 机 、 商 用 服务 负 
和 局 性 能 计算 机 等 众多 领域 ,多 核 反 术 及 其 相关 人 研究 也 迅速 发 展 , 如 多 核 结构 放 计 方法 、 片 
上 互 连 拉 术 .可 重 构 技 术 、 下 一 代 众 核 技术 等 。 

多 核 处 理 癌 将 多 个 完全 功能 的 核心 集成 在 同一 个 起 片 内 ,整个 起 片 作为 一 个 统一 的 结 
构 对 外 提供 服务 ,输出 性 能 。 多 核 处 理 右 自 先 通过 集成 多 个 单线 程 处 理 核心 或 者 集成 多 个 
同时 多 线程 处 理 核心 ,使 得 整个 处 理 禹 可 同时 执行 的 线程 数 或 任务 数 是 单 处 理 右 的 数 们 ,这 
极 大 地 提升 了 处 理 生 的 并 行 性 能 。 其 次 ,多 个 核 集 成 在 片 内 , 极 大 地 缩短 了 核 间 的 互 连 线 ， 
核 间 通信 延 退 变 小 ,提高 了 通信 效率 ,数据 传输 审视 也 得 到 了 提高 。 再 者 ,多 核 结构 有 效 共 
孚 和 痪 源 , 片 上 资源 的 利用 靳 得 到 了 提高 , 功 耗 也 随 着 着 件 的 减少 得 到 了 降低 。 最 后 ,多 核 结 
爸 简单 ,多 于 优化 设计 ,扩展 性 强 。 这 些 优 执 最终 推动 了 多 核 的 发 展 并 逐 湖 取代 单 处理 甫 成 
为 主流 。 

在 整体 结构 设计 上 多 核 处 理 徊 与 传统 的 单 处 理 右 相 比 ,多 核 内 部 结构 没有 固定 的 组 织 
形式 ,可 以 有 很 多 种 实现 方式 。 各 个 饶 究 机 构 和 厂商 根据 日 己 的 应 用 目标 设计 出 结构 完全 
不 同 的 多 核 结构 。 虽 然 如 此 ,但 在 已 有 的 多 核 处 理 硕 中 仍 存 在 几 种 比较 典型 的 结构 ,它们 分 
别 代 表 了 了 多核 处 理 带 结构 中 的 某 一 类 特点 ,而 Hydra、Cell 和 RAW 处 理 带 就 是 三 种 典型 的 
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Hydra 处 理 带 是 1996 年 美国 斯 坦 福 大 学 人 研制 的 集成 了 4 个 核心 的 处 理 大 ,这 在 当时 是 


一 种 新 型 的 处 理 需 结构 。 

Hydra 在 一 个 芯片 上 集成 了 4 个 核心 ,核心 间 通 过 总 线 结构 共享 片上 二 级 缓存 .存储 器 
端口 和 I/O 访问 端口 ,整体 结构 如 图 8-25 所 示 。4 个 核心 采用 了 通用 的 百 万 指令 级 
(MIPS) 处 理 硕 ,每 个 独立 的 处 理 核心 有 私有 的 一 级 缓存 ,其 中 指令 缓存 和 数据 缓存 相互 分 
离 。4 个 核心 共享 的 二 级 缓存 ,采用 DRAM 存储 。 核 心 之 间 核心 到 二 级 缓存 、 主 存 与 片 内 
以 及 I/O 〇 设备 与 片 内 的 通信 都 是 由 总 线 结 构 来 实现 的 。Hydra 被 认为 是 一 种 典型 的 多 核 
结构 ,不 仅 在 于 它 是 第 一 个 多 核 处 理 需 设计 原型 ,还 因为 它 采 用 了 共享 二 级 缓存 的 同 构 对 称 
设计 和 基于 高 速 总 线 的 核 间 通信 方式 。 


集中 式 总 线 仲裁 器 


直 写 式 总 线 
谈 / 写 回 总 线 


上 夏 上 L2 缓 存 主 存 接口 一 MO 总 线 接 口 


DRAM 主 在 IO 设备 


图 8-25 ”Hydra 处 理 器 结构 


2. Cell 处 理 器 


2001 年 3 月 ,IBM 与 Sony、Toshiba 合作 ,着 手 开 发 一 种 全 新 的 入 
器 , 旨 在 以 高 效 
图 8-26 所 示 。 

Cell 处 理 器 主要 包含 9 个 核心 .一 个 存储 器 控制 器 和 一 个 VO 控制 器 ,片上 的 部 件 互联 
电线 将 它们 连接 在 一 起 。 核 间 通 信和 访问 外 部 端口 均 是 通过 内 部 总 线 进行 的 ,而 且 为 了 便 
于 核 间 通信 ,整个 Cell 内 部 采用 统一 编 址 。 这 9 个 核心 由 一 个 PowerPC 通用 处 理 占 
(Power Processing Element, PPE) 和 8 个 协 处 理 古 (CSynerglstic Processing Element,SPE) 
组 成 。PPE 是 一 个 有 二 级 缓存 结构 的 64 位 PowerPC 处 理 核心 。SPE 是 一 个 使 用 本 地 存 
储 右 的 32 位 微 处 理 器 , 它 没有 采用 缓存 结构 。PPE 与 SPE 除了 在 结构 上 不 同 外 ,它们 的 功 
能 也 有 差别 ,PPE 是 通用 微 处 理 伸 ,拥有 完整 的 功能 ,主要 职能 是 负责 运行 基本 程序 和 协调 
SPE 间 任 务 的 运行 ; SPE 则 是 结构 较 简 单 , 只 用 来 从 事 浮 点 运算 。Cell 的 这 种 不 对 称 结构 
锌 认为 是 一 种 典型 的 寞 构 多 核 结 构 。 


处 理 右 结构 Cell 处 理 
率 \ 低 功 耗 来 处 理 下 一 代 客 市 多 媒体 与 图 形 应 用 。Cell 处 理 右 的 内 部 结构 如 
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美国 麻 省 理工 学 院 研究 的 可 重 构 RAW 处 理 顺 芯片 采用 了 一 种 Tile 结构 的 多 核 处 理 
耸 发 展 思路 。RAW 处 理 表 结构 主要 由 16 个 Tile 单元 和 片上 网 络 构 成 ,如 图 8-27 所 示 。 
片上 的 每 个 Tile 单元 是 一 个 完整 的 计算 核心 ,负责 处 理 
各 种 运算 , 它 包 含 了 处 理 熏 、 浮 点 运算 单元 ,指令 和 数据 
缓存、 静态 和 动态 路 由 结构 。 片 上 网 络 是 由 可 编程 的 、 
高 度 集成 的 互 连 结构 构成 的 。 

互 连 结构 中 的 同步 网 络 端口 ,让 Tile 间 的 访问 通信 
延 开 很 小 ,性 能 接近 寄存 着 的 访问 存 取 。RAW 中 的 
Tile 单元 还 能 通过 片上 网 络 和 芯片 边 绿 的 逻辑 通道 ,高 
速 简单 地 连接 到 外 部 存储 需 资 源 和 各 种 IO 设备 ,可 直 
接 执行 存储 器 存 取 。 由 于 RAW 处 理 器 结构 简单 , 功 耗 
小 ,可 扩展 ,而 且 片 上 网 络 通 信和 效率 高 ,因此 RAW 结构 
被 认为 是 片上 网 络 多 核 结构 的 代表 。 


8.5.3 多 核发 展 的 关键 技术 


多 核 处 理 侣 结构 不 仅 有 性 能 潜力 大 、 集 成 度 高 .并行 度 高 结构 价 单 和 设计 验证 方便 等 
请 多 优势 ,而 且 它 还 能 继承 传统 单 处 理 各 人 研究 中 的 茶 些 成 条 ,例如 同时 多 线程 、 冤 发 射 指令 、 
降 压 低 功 耗 撤 术 等 。 但 多 核 处 理 表 毕 欧 是 一 种 新 的 结构 ,在 多 核 结构 设计 和 应 用 开发 中 出 
现 了 以 前 未 曾 遇 到 的 新 问题 ,这 些 问 题 给 多 核 处 理 天 的 未 来 提出 了 挑战 。 


多 核 处 理 器 的 核心 结构 主要 有 同 构 和 异 构 两 种 。 同 构 结 构 采 用 对 称 设计 ,原理 简单 , 硬 


较 易 实现 。 当 前 主流 的 双核 和 四 核 处 理 严 基本 上 都 采用 同 构 结构 。 同 构 设 计 的 问题 在 
数量 的 不 断 增多 ,如 何 保持 各 个 核心 的 数据 一 臻 ;如何 满足 核心 的 存储 访问 
和 LO 访问 需求 ; 如 何 选 择 一 个 各 方面 性 能 均衡 、 面 积 较 小 以 及 功 耗 较 低 的 处 理 头 ; 如 何 
平衡 知 干 处 理 喜 的 负载 和 任务 协调 等 。 

与 同 构 结 构 相 比 , 异 构 的 优势 是 通过 组 织 不 同 特点 的 核心 来 优化 处 理 需 内 部 结构 ,实现 
处 理 右 性 能 的 最 佳 化 ,而 且 能 有 效 地 降低 功 耗 。 但 是 异 构 结构 也 存在 看 一 些 难 点 。 自 先 , 搭 
配 哪 几 种 不 同 的 核 , 核 间 任 务 如 何 分 工 以 及 如 何 实现 。 其 次 ,结构 是 否 具 有 良好 的 扩展 性 ， 
还 是 受到 核心 数量 的 限制 。 再 者 ,处 理 融 指令 系统 设计 和 实现 也 是 问题 。 因 为 不 同 核 所 用 
的 指令 系统 对 系统 的 实现 也 是 很 重要 的 ,那么 采用 这 些 不 同 的 核 ,是 采用 相同 的 指令 系统 还 
是 不 同 的 指令 系统 ,能 否 运行 操作 系统 等 ,也 是 需要 考虑 的 内 容 。 


2. 存储 结构 设计 


处 理 毅 与 主 存储 喜之 间 的 速度 差距 一 直 是 处 理 带 结构 设计 中 必须 考虑 的 问题 ,因为 存 
储 系 统 目 身 的 体系 结构 设计 直接 关系 到 系统 的 整体 性 能 ,会 对 整个 必 片 的 矿 才 、 功 耗 、 布 局、 
性 能 以 及 运行 效率 等 各 方面 产生 很 大 的 影响 。 以 往 在 单 处 理 顺 中 通过 采用 缓存 结构 基本 上 
能 较 好 地 解决 这 个 问题 ,能 保证 处 理 需 性 能 得 到 发 挥 。 可 是 ,发 展 到 了 多 核 处 理 希 时 代 , 核 
心 和 主 存 之 间 因 速度 差距 而 市 来 的 问题 变 得 严重 了 。 由 于 处 理 徊 内 部 核心 数目 增多 ,对 主 
存 的 访问 需求 增加 ,而 单 处 理 右 时 代 的 缓存 层次 和 访问 市 客 已 经 不 能 跟 上 多 核 处 理 兹 的 访 

南 求 ,必须 针对 多 核 处 理 带 进行 相应 的 存储 续 构 设计 ,并 解决 好 存储 系统 的 效率 问题 。 

对 存储 系统 议 计 , 绝 大 多 数 处 理 辫 采用 缓存 设计 ,也 有 些 处 理 带 及 用 了 片上 存储 融 绪 
构 。 绥 人 存 结构 设计 的 优点 是 人 硬件 设计 与 实现 容 多 ,多 于 应 用 开发 与 编程 ,缺点 是 需要 保证 组 
人 存 数据 的 一 致 ,而 且 绪 构 扩 展 不 易 。 针 对 缓存 数据 一 致 性 问题 ,其 解决 案 略 主要 有 总 线 侦 听 
协议 和 基于 目录 的 目录 协议 。 侦 听 协 议 是 每 块 缓存 通过 缓存 侦 听 希 时 候 听 和 总线, 以 接受 一 
致 性 命令 ,不 足 的 是 它 只 适合 核心 数目 较 少 的 情况 。 目 录 协 议 是 通过 目录 表 记 录 目 身 人 存储 
块 在 其 他 缓存 中 的 状态 ,以 便 维 持 一 致 性 时 使 用 点 对 点 的 通信 ,缺点 是 实现 代价 太 大 ,并 发 
访问 目录 时 存在 性 能 瓶 贷 。 除 了 上 述 的 人 硬件 一 致 性 算法 ,还 有 基于 多 人 处理 机 的 软件 一 致 性 
算法 ,但 能 否 作为 多 核 结 构 的 缓存 一 致 性 机 制 ,这些 需要 进一步 的 探讨 研究 。 目 前 大 多 数 多 

片 内 存储 天 是 将 片 外 的 存储 全 引 到 瞩 内 , 它 与 片 外 存储 融 一 样 是 统一 编 址 的 ,因此 它 避 
开 了 绥 存 不 命中 和 一 致 性 问题 ,但 由 于 米 用 了 存储 问 结 构 , 其 访问 延迟 较 缓 存 大 。 当 前 一 些 
人 研究 人 员 通 过 来 用 高 速 动 态 随 机 存储 人 磊 来 组 成 片 内 存储 副 , 顷 小 了 与 绷 存 间 的 性 能 差距 。 

除了 选择 何 种 存储 结构 外 ,存储 结构 设计 的 问题 还 有 : 存储 夭 多 大 比较 合适 ; 在 哪 一 
级 实现 数据 的 共享 和 通信 比较 合适 ; 在 哪 一 级 解决 缓存 一 致 性 问题 比较 合理 ; 存储 结构 如 
何 文 持 多 线程 的 应 用 等 。 


3. 片上 通信 


多 核心 片上 的 多 个 核心 虽然 各 目 执行 目 已 的 代码 ,但 是 不 同 核 间 可 能 需要 进行 数据 的 
共享 和 同步 ,因此 片上 通信 结构 的 性 能 将 直接 影 啊 处 理 表 的 性 能 。 当 前 ,片上 通信 主要 有 三 
种 方式 : 总 线 共 享 .交叉 开关 互 连 和 片上 网 络 (Network On Chip, NOC)， 
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总 线 共 享 结构 是 指 片 上 核心 .输入 输出 端口 以 及 存储 项 通过 共享 二 级 或 三 级 cache, 或 
者 通过 连接 核心 的 总 线 进行 通信 。 总 线 结 构 的 长 处 是 较为 简单 ,易于 设计 实现 ,当前 多 数 双 
核 和 四 核 处 理 喜 基本 上 都 采用 了 该 结构 ,但 缺点 是 总 线 结构 可 扩展 性 较 差 ,适用 于 核心 数 较 
少 的 情况 。 比 较 典 型 的 总 线 共 至 结构 处 理 磊 有 Hydra Intel 的 Core、IBM 的 Power4/5 等 。 

交叉 开关 互 连 结构 由 交叉 开关 以 及 接口 逻辑 构成 。 交 叉 开关 与 总 线 结构 相 比 ,优势 是 
数据 通道 多 ,访问 带宽 更 大 ,但 不 足 是 交叉 开关 结构 占用 的 片上 面积 也 较 大 ,而 且 随 着 核心 
数 的 增加 ,性 能 也 会 下 降 , 因 此 它 也 只 适用 于 核心 数 较 少 的 情况 。 例 如 AMD 公司 的 
Athlonx2 双核 处 理 器 用 交叉 开关 来 控制 核心 与 外 部 的 通信 。 

片上 网 络 把 互联 网 络 用 于 片上 系统 设计 ,解决 片上 组 件 之 间 的 通信 问题 , 它 信 鉴 了 并 行 
计算 机 的 互联 网 络 。 片 上 网 络 与 并 行 计算 机 的 互 连 有 很 多 相同 点 : 支持 包 通 信和 ,可 扩展 \ 提 
供 透 明 的 通信 服务 等 ; 但 也 有 不 同 之 处 : 片上 网 络 技 术 支 持 同 时 访问 ,而 且 有 可 靠 性 高 以 
及 可 重用 性 高 等 特点 。 它 与 总 线 结构 、 交 又 开关 结构 相 比 ,可 以 连接 更 多 IP 组 件 、 可 靠 性 
高 、 可 扩展 性 强 以 及 功 耗 较 低 ,因此 片上 网 络 被 认为 是 更 加 理想 的 大 规模 CMP 互联 技术 。 
当前 片上 网 络 主要 有 二 维 网 格 网 络 、3KTours 等 互联 结构 。 片 上 网 络 设 计 的 问题 是 寻找 网 
络 开 销 和 多 核 耦 合 程度 最 佳 的 平衡 ,并 同时 考虑 网 络 的 可 扩展 性 。RAW 处 理 郑 就 采用 了 
片上 二 维 网 络 结构 , 它 通 过 集成 高 速 网 络 和 优化 的 路 由 算法 ,片上 核心 间 的 通信 延迟 最 大 不 
会 超过 6 个 周期 ,而且 该 结构 可 扩展 性 强 。 

这 三 种 绪 构 昌 各 有 优势 和 不 足 , 但 亦 可 融合 ,如 在 全 局 范围 及 用 片上 网 络 而 在 局 部 选择 
总 线 或 者 交叉 开关 结构 ,以 实现 性 能 与 复杂 性 的 平衡 。 


4. 低 功 耗 


传统 单 处 理 右 的 一 个 瓶 贷 就 古 随 看 频率 的 提升 , 功 耗 越 来 越 高 ,最 终 使 得 心 片 无 法 正常 
运行 。 在 早期 的 多 核 处 理 副 设计 中 ,主要 通过 降低 核心 频率 来 降低 处 理 各 的 功 耗 ,但 是 这 样 
限制 了 核心 的 运算 性 能 ,并 没有 从 根本 上 实现 高 性 能 、 低 功 耗 的 目的 。 功 耗 过 高 不 仅 寻 致 能 
源 消耗 ,而 且 热 推 积 和 过 高 的 功 耗 密度 也 会 对 系统 稳定 性 造成 影响 。 现 在 一 个 必 上 片上 可 以 
集成 10 亿 个 晶体 管 , 如 此 众多 的 片上 贰 源 , 如 何 控制 它 的 功 耗 ,保持 较 启 性 能 ,成 为 了 一 个 
重要 的 问题 。 

在 多 核 处 理 表 产生 以 前 , 低 功 耗 技术 主要 有 降低 动态 消耗 和 降低 静态 消耗 技术 两 方面 。 
动态 消耗 包括 处 理 表 内 部 各 元 件 正 第 工作 时 所 消耗 的 电能 ,例如 电容 性 的 充 放电 、 切 换 频 
率 、 远 辑 1 门 的 状态 转换 等。 降低 动态 消耗 一 了 二 以 来 部 是 人 们 人 研究 的 重点 ,而 且 拉 术 比 较 成 
束 。 降 低 动 态 消 耗 技 术 现 在 主要 有 多 元 功能 电压 技术 ,动态 电压 调 记 时 钟 屏 贡 技 术 等 。 毅 
人 态 消 耗 技 术 是 指 来 日 源 电 流 的 功率 消耗 ,特点 是 即使 元 件 处 在 空 用 状态 也 会 消耗 电能 ,具体 
包括 亚 国 值 汤 电 流 和 门 源 电 流 。 降 低 静 态 消 耗 拉 术 的 主要 技术 有 通 志 长 度 调 整 、 寄 和 存 靛 锁 
存 拉 术 、 能 量 选 通 技 术 等 。 

上 面 两 方面 的 技术 主要 在 电路 层次 上 去 进行 低 功 耗 设 计 和 技术 开发 。 在 多 核 处 理 表 出 
现 以 前 ,这 些 拉 术 便 已 出 现在 单 核 处 理 侣 上。 随 看 多 核 处 理 胡 的 产生 ,由 于 多 核 处 理 各 在 结 
构 和 实现 上 有 了 新 的 特点 ,所 以 钱 究 人 员 又 在 新 的 方面 发 现 了 降低 功 耗 的 方法 ,例如 寞 构 结 
构 设 计 \ 动 态 线程 分 派 与 半 移 技术 等 。 寞 构 的 结构 设计 就 是 利用 寞 构 结 构 对 片上 帝 源 的 最 
佳 化 配置 ,处 理 右 的 执行 效率 提升 ,使 得 处 理 带 不 仅 具 有 高 性 能 也 降低 了 功 耗 。 动 态 线程 分 
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派 与 转移 技术 是 指 利用 多 核心 处 理 能 力 , 将 某 个 核心 上 过 多 的 负载 转移 到 负载 小 的 核心 上 ， 
从 而 使 处 理 器 在 不 降低 处 理性 能 的 情况 下 ,降低 处 理 器 功 耗 。 

研究 人 员 还 通过 对 操作 系统 的 设计 和 优化 来 降低 多 核 处 理 器 的 运行 功 耗 。 例 如 当 任务 
较 少 时 ,操作 系统 会 关闭 一 个 核心 或 降低 处 理 器 频率 ,并 降低 封锁 转速 ,来 使 整个 系统 降低 
消耗 。 因 此 , 低 功 耗 设计 包含 了 电路 级 ,结构 级 ,算法 级 和 操作 系统 级 等 多 个 方面 的 内 容 ,是 
一 个 需要 从 多 方面 进行 综合 考虑 的 问题 。 


5. 平衡 设计 原则 


平衡 设计 原则 是 指 在 芯片 的 复杂 度 .内 部 结构 、 性 能 、 功 耗 、 扩 展 性 .部 件 成 本 等 各 个 方 
面 做 一 定 的 权衡 , 即 不 能 为 了 单纯 地 获得 某 一 方面 的 性 能 而 导致 其 他 方面 的 问题 ,在 设计 过 
程 中 要 坚持 从 整体 结构 的 角度 去 权衡 各 个 具体 的 结构 问题 ，。 

在 多 核 处 理 器 设计 工程 中 ,需要 坚持 平衡 设计 的 原则 。 因 为 往往 在 减少 一 个 方面 问题 
的 同时 就 增加 了 男 一 个 方面 的 问题 ,所 以 在 设计 过 程 中 要 仔细 权衡 对 某 些 问题 的 解决 方法 ， 
& 量 采用 简单 ,易于 实现 ,成 本 低廉 而 且 对 整体 性 能 影响 不 大 的 设计 。 微 处 理 结 构 设 计 的 重 
点 不 在 于 其 中 某 一 个 细节 采用 什么 复杂 或 性 能 表现 较 好 的 设计 ,而 是 在 于 整体 的 设计 目标 。 
也 即 是 说 要 得 到 在 一 个 通 芝 情 况 下 ,逻辑 结构 简单 和 对 大 多 数 应 用 程序 有 恨 好 性 能 的 微 处 
理 器 结构 ,在 适当 的 时 候 为 了 整体 目标 就 不 得 不 牺牲 某 一 方面 。 当 然 在 具体 的 设计 中 ,不 能 
只 是 简单 地 选择 ,应 该 是 建立 在 科学 的 实验 和 模拟 分 析 基 础 上 的 选择 或 平衡 。 因 此 在 多 核 
处 理 需 设计 中 ,要 以 科学 分 析 的 数据 结果 为 基础 ,坚持 合理 平衡 的 设计 原则 。 


6. 软件 应 用 开发 


多 核 处 理 融 在 利用 多 个 核心 的 并 行 执 行 能 力 来 提高 处 理 闹 运算 性 能 的 同时 ,也 给 软件 
开发 者 市 来 了 厅 烦 。 当 前 的 困境 是 众多 应 用 并 没有 利用 多 核 的 性 能 淤 力 ,多 核 的 性 能 优 努 
序 的 编程 工具 和 环境 ; 为 一 方面 是 一 些 应 用 的 线程 级 加 速 潜力 有 限 。 

并 行 编程 困难 的 问题 从 并 行 计算 机 产生 以 来 就 存在 ,只 是 随 着 多 核 的 主流 化 ,问题 更 加 
突出 了 了。 多 核 系统 下 的 并 行 编程 ,主要 是 开发 多 核 的 线程 级 并 行 性 ,但 是 已 有 的 并 行 编程 模 
式 、 编 程 语 言 不 能 完全 适合 多 核 环境 ,不 能 将 多 核 的 多 线程 并 行 浅 力 完 全 发 挥 出 来 ,例如 
OpenMP MPI 并行 C 等 。 因 此 ,针对 多 核 环境 下 对 并 行 编程 应 用 的 和 要求, 许多 人 研究 机 构 和 
公司 一 方面 对 现 有 的 并 行 编程 模型 和 编程 声言 进行 修改 和 改进 ,例如 改进 文 持 共 理 存 储 结 
构 的 OpenMP、OpenMP 十 MPI 的 混合 编程 模型 .PThread 多 线程 编程 模型 ; 为 外 一 方面 ， 
在 资金 项 目的 支持 和 市 场 的 推动 下 ,各 类 人 研究 机 构 也 正在 积极 研制 开发 新 一 代 的 并 行 编程 
模型 和 并 行 编程 语言 ,例如 事务 存储 编程 模型 .Intel 公司 的 C++ 编程 模型 TBM 公司 的 X10 
语言 、Sun 公司 的 Fortress 语言 .Cray 公司 的 Chapel 语言 等 。 

为 外 一 方面 ,多 数 应 用 的 并 行 加 速 潜力 有 限 是 因为 在 实际 应 用 中 ,可 供 程 序 员 还 速 开 发 
出 来 的 程序 还 是 单线 程 的 ,同时 多 数 应 用 也 是 用 C 或 C++ 编写 的 ,它们 一 下 被 设计 为 单线 
程 ,而 单线 程 程序 中 所 能 开发 和 利用 的 并 行 性 始终 是 有 限 的 。 所 以 对 于 这 些 应 用 ,要 么 重新 
编写 并 行 代码 ,要 么 钱 发 面 癌 多 核 结 构 的 日 动 并 行 化 工具 ,使 得 这 些 应 用 能 在 多 核 处 理 盘 系 
统 中 癌 效 应 用 。 
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8.5.4 多 核发 展 趋势 


多 核 处 理 融 产生 的 直接 原因 是 蔡 代 单 处 理 硕 ,解决 微 处 理 带 的 发 展 瓶 矣 ,但 发 展 多 核 的 
深层 次 原因 还 是 为 了 满足 人 类 社会 对 计算 性 能 无 止境 的 需求 ,而 且 这 种 压力 还 会 持续 下 去 。 
即便 在 当前 ,设计 者 已 经 有 效 地 将 多 核 性 能 提高 到 了 一 个 新 的 水 平 ,可 是 人 们 对 提升 性 能 的 
海 望 并 未 停顿 。 阻 三 多 核 性 能 回 更 局 水 平 发 展 的 问题 很 多 ,可 真正 束缚 多 核发 展 的 是 低 功 
耗 和 应 用 开发 两 个 问题 。 由 于 现 有 的 多 核 结 构 设 计 方 法 和 技术 还 不 能 有 效 地 处 理 好 这 两 个 
问题 ,因此 有 必要 在 原 有 技术 的 基础 上 探索 新 的 思路 和 方法 。 下 面 的 内 容 是 为 了 实现 局 性 
能 、 低 功 耗 和 高 应 用 性 的 目标 多 核 处 理 冀 呈现 的 几 种 发 展 趋势 

(1) 多 核 上 将 集成 更 多 结构 简单 . 低 功 耗 的 核心 。 为 了 满足 性 能 需求 ,通过 集成 更 多 核 
心 来 提高 性 能 是 必然 选 泉 ,但 是 核心 的 结构 也 必须 考虑 。 因 为 如 果 核 心 结构 过 于 复杂 , 随 看 

心 数 量 的 增多 ,不仅 不 能 提升 性 能 ,还 会 市 来 线 延 氏 增 加 和 功 耗 变 大 等 问题 。 例 如 ,2007 
年 Tilera 公司 和 Plurality 公司 分 别 推出 目 己 的 64 核 处 理 表 产品 ,而 Intel 公司 也 将 推出 80 
个 核心 的 低 功 耗 处 理 甫 。 

(2) 异 构 多 核 是 一 个 重要 的 方 问 。 人 研究 表明 ,将 结构 .功能 、 功 耗 、 运 算 性 能 各 不 相同 的 
多 个 核心 集成 在 已 片上 ,并 通过 任务 分 工 和 划分 将 不 同 的 任务 分 配给 不 同 的 核心 ,让 每 个 核 
心 处 理 目 己 擅 长 的 任务 ,这 种 异 构 组 织 方式 比 同 构 的 多 核 处 理 带 执行 任务 更 有 效率 ,实现 了 
资源 的 最 佳 化 配置 ,而 且 降 低 了 整体 功 耗 。 

(3) 多 核 上 应 用 可 重 构 搁 术 。 大 规模 高 性 能 可 编程 右 件 的 出 现 , 推 动 了 现场 可 编程 门 
阵列 (Field Programmable Gate Arrays,FPGA) 技 术 的 发 展 。 在 芒 片 上 应 用 FPGA 技术 有 
局 灵活 性 、 高 可 徘 性 、 融 性 能 \ 低 能 耗 和 低 成 本 多 种 优势 。 微 处 理 右 设计 人 员 注 意 到 了 这 
种 优势 ,并 将 FPGA 等 可 重 构 技 术 应 用 到 多 核 结 构 上 ,让 结构 具备 可 重 构 性 和 可 编程 性 。 
这 种 创新 思路 大 大 提高 了 多 核 的 通用 性 和 运算 性 能 ,使 处 理 硕 既 有 通用 微 处 理 着 的 通用 
性 ,又 有 专用 集成 电路 的 高 性 能 ,使 之 莱 具 录 活 性 、 高 性 能 、 高 可 靠 , 低 能 耗 等 众多 优良 
竺 点 。 
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超级 计算 机 “天 河 二 号 ” 

“天 河 二 号 ”是 集群 式 超 级 计算 机 系统 ,由 中 国 国 防 科学 技术 大 学 研制 成 功 , 其 峰值 计算 
速度 为 每 秒 5.49 亿 亿 次 .持续 计算 速度 为 每 秒 3.39 亿 亿 次 双 精 度 浮 点 运算 ,性 能 优异 。 在 
2014 年 6 月 23 日 公布 的 全 球 超 级 计算 机 TOP 500 强 榜 单 中 ,中 国 “ 天 河 二 号 ?的 速度 位 居 
榜首 ,成 为 全 球 最 快 的 超级 计算 机 。 

1) 系统 组 成 

“天 河 二 号 ”由 16 000 个 浪潮 的 节点 组 成 ,共有 170 个 机 柜 , 包 括 125 个 计算 机 柜 、8 个 
服务 机 柜 、13 个 通信 机 柜 和 24 个 存储 机 柜 , 占 好 面积 720 平方 米 , 最 大 运行 功 耗 17. 8MAW， 
具体 技术 参数 如 下 。 

处 理 器 : 16 000 个 运算 节点 ,每 节点 配备 两 个 Xeon E5 中 央 处 理 器 ,三 个 Xeon Phi 57 
核心 的 协 处 理 器 (运算 加 束 卡 )。 累 计 32 000 个 Xeon E5 主 处 理 器 和 48 000 个 Xeon Phi 协 
处 理 器 , 共 312 万 个 计算 核心 。 


中 央 处 理 器 为 Intel 公司 提供 的 ,运作 时 钟 频 认为 2.2GHz 的 Xeon E5-2692 12 核心 处 
理 器 ,基于 Intel Ivy Bridge 徽 架 构 (Ivy Bridge-EX 核心 ), 未 用 22nm 制程 ,峰值 性 能 
0.2112IFLOPS, 

运算 加 速 上 ,使 用 基于 Intel 集成 众 核 架构 的 Xeon Phi 31S1P 协 处 理 器 ,运行 时 钟 为 
1. 1GHz, 每 个 使 用 61 个 核心 中 的 57 个 (因为 使 用 61 个 会 存在 运算 周期 协调 问题 ), 每 核心 
借 由 特殊 的 超 线程 技术 能 运作 4 个 线程 ,产生 峰值 性 能 为 1.003TFLOPS。 

内 存 : 每 个 节点 拥有 64GB 主 存 , 而 每 个 Xeon Phi 协 处 理 器 板 载 8GB 内 存 , 故 每 节点 
共 88GB 内 存 , 束 体 总 计 内 存 1.408PB。 

外 存 : 12. 4PB 容量 的 硬盘 阵列 。 

主板 、 机 架 与 机 柜 均 由 浪潮 集团 制造 ,共有 125 个 计算 机 柜 , 每 个 机 柜 容 纳 4 个 机 架 , 每 
个 机 架 容 纳 16 块 主板 ,每 个 主板 设置 有 两 个 计算 节点 。 每 块 主板 上 分 为 APU 模块 和 CPM 
模块 两 部 分 ,AAPU 部 分 承载 5 块 Xeon Phi,CPM 部 分 承载 ] 块 Xeon Phi 十 4 颗 Xeon E5， 

APU 模块 和 CPM 模块 之 间 以 CPU 内 部 提供 的 PCI-E 3.0 16x 接口 进行 连接 ,但 实际 
由 于 Xeon Phi 的 硬件 限制 , 仅 支持 至 PCI-E 2.0 16x, 单 通道 数据 传输 速率 为 10Gby/s。 

前 端 处 理 器 : 计算 节点 前 端 处 理 器 为 4096 晒 FET-1500 16 核心 SPARC V9 架构 的 处 理 
器 ,40nm 制程 ,运作 时 钟 频率 1.8GHz, 热 设计 功 耗 65W ,峰值 性 能 144GFLOPS。 

连接 ; 使 用 光电 混合 传输 技术 (Optoelectronlcs Hybrid Transport Technology) ,使 用 
自制 的 TH Express-2 主干 拓扑 结构 网 络 连 接 , 以 13 个 大 型 路 由 器 通过 576 个 连接 端口 以 
光电 传输 介质 与 各 个 运算 节点 互联 ,控制 器 名 为 NRC, 使 用 90nm 制程 ,单个 控制 器 的 数据 
吞吐 量 2.56Tby/s, 终 端 网 络 接口 使 用 名 为 NIC 的 控制 器 ,以 PCI-E 2.0 接口 连接 ,数据 传送 
速率 为 6. 36GB/s。 

操作 系统 : 主 有 鹿 操作 系统 .基于 资源 管理 用 单一 Linux 公用 程序 (Simple Linux Utility 
for Resource Management,SLURMI) 的 全 局 资源 管理 。 

能 耗 : 整 机 功 耗 17 808kW ,在 搭载 水 冷 散 热 系统 以 后 , 功 耗 将 达到 24MW ,每 瓦 性 能 为 
1. 901GF LOPS, 

2) 关键 技术 

“天 河 二 己 "取得 了 一 系列 技术 创新 和 突破 ,涉及 体系 结构 尾 片 技术 、 癌 速 互 连 、 存 储 架 
构 、 编 程 模型 能 耗 控制 .系统 管理 .结构 工艺 等 诸多 方面 ,使 得 “天 河 二 号 ”综合 技术 取得 了 
国际 领先 地 位 。 

“天 河 二 号 ?基于 新 型 措 构 多 态 体系 结构 ,在 强化 科学 工程 计算 的 同时 ,可 高 效 支 持 大 数 
据 处 理 \ 高 吞吐 量 和 高 安全 信息 服务 等 多 类 应 用 需求 ; 采用 了 微 异 构 计 算 阵 列 和 新 型 并 行 
编程 模型 及 框架 ,提升 了 应 用 软件 的 兼容 性 、 适 用 性 和 吻 用 性 。“ 天 河 二 和 号 ”服务 阵列 采用 了 
国内 主 频 最 高 的 自主 高 性 能 通用 CPU FT-1500, 有 上 县 有 高 吞吐 量 和 高 安全 信息 服务 功能 。 基 
于 自主 通信 接口 芯片 和 互联 交 挽 芯片 设计 实现 了 光电 混合 的 自主 定制 高 速 互联 系统 ,性 能 
是 当前 国际 上 最 先进 的 商用 互联 系统 的 2 售 。 采 用 综合 化 的 能 耗 控 制 机 制 ,能 效 比 进入 国 
际 先 进行 列 。 设 计 实 现 了 基于 背 板 前 后 对 插 、 水平 育 播 的 锅 客 度 闹 精度 组 冻结 构 , 使 得 “天 
河 二 号 ?的 计算 密度 处 于 国际 领先 水 平 。 

3) 应 用 领域 

“天 河 二 号 ”已 应 用 于 生物 医药 、 新 材料 、 工 程 设计 与 仿真 分 析 、 天 气 预 报 、 智 慧 城市 、 电 
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子 商务 、 云 计算 与 大 数据 .数字 媒体 和 动漫 设计 等 多 个 领域 ,还 将 在 生命 科学 、 材 料 科学 、 大 
气 科 学 、 地球 物 理 、 宇 宙 、 经 济 学 ,以 及 大 型 基因 组 组 装 、 基 因 测 序 、 污 染 治理 等 一 系列 事 关 国 
计 民生 的 大 科学 大 工程 中 "大 显 身手”。 此 外 ,国家 超 算 广州 中 心 积极 推动 国际 交流 与 合 
作 , 利 用 “天 河 二 号 ”为 国外 研究 机 构 提 供 高 性 能 计算 服务 。 

超级 计 和 民 机 的 应 用 涉及 各 行 各 业 , 需 要 很 乡 字 科 的 深度 学 科 背 景 和 专业 人 才 , 才 能 将 该 
领域 的 大 型 软件 开发 出 来 。 因 此 与 美国 等 一 些 发 达 国家 相 比 ,我 国 在 产业 能 力 和 应 用 水 平 
等 方面 还 有 差距 。 


本 章 小 结 


本 章 主 要 讲述 了 以 下 内 容 : 

(1) 计算 机 系统 的 并 行 性 。 介 绍 了 计算 机 体系 结构 的 概念 ,体系 结构 中 的 并 行 性 ; 介 
绍 了 时 间 重 车 资源 重复 和 资源 共 圣 三 种 提 融 并 行 性 的 主要 技术 途径 ; 并 对 并 行 计算 机 体 
系 结构 的 Flynn 分 类 法 进行 了 讲述 。 

(2) 流水 线 搁 术 。 介 绍 了 流水 线 的 定义 、 分 类 ,主要 性 能 参数 ( 耕 吐 量 、 加 速 比 和 效率 ) 
和 流水 线 中 产生 的 相关 问题 ; 结合 例子 分 析 了 如 何 进行 流水 线 调度 及 流水 线 调度 方案 的 选 
取 方 法 ; 并 介绍 了 超 流水 线 处 理 机 和 超标 量 超 流水 处 理 机 。 

(3) 多 处 理 机 系统 。 介 绍 了 多 处 理 机 的 主流 SMP 和 DSM; 讲述 了 多 处 理 机 的 cache 
一 致 性 问题 和 多 处 理 机 操作 系统 及 多 处 理 机 的 并 行 性 的 实现 。 

(4) 机 群 系统 。 人 介绍 了 机 群 系统 的 定义 、 组 成 及 其 关键 技术 。 

(5) 多 核 处 理 磊 。 介 绍 了 多 核 处 理 疾 的 定义 、 典 型 结构 、 影 啊 多 核 人 处理 带 发 展 的 关键 技 
术 , 展 望 了 多 核 人 处 理 右 的 发 展 趋 势 ， 


2， 并 发 性 3 时间 重 半 
5. 相关 6. SISD 


1. 从 执行 程序 的 角度 看 ,以 下 并 行 性 等 级 最 高 的 为 (  )。 

A. 指令 内 部 并 行 B. 指令 级 并 行 

C. 线程 级 并 行 D. 任务 级 或 过 程 级 并 行 
2. 从 处 理 数据 的 角度 ,以 下 并 行 性 等 级 最 高 的 为 (  )。 

A. 字 串 位 串 B. 字 串 位 并 C. 字 并 位 串 D. 全 并 行 
3. 按照 Flynn 分 类 法 ,以 下 ( ”) 计 算 机 系统 属于 真正 的 单 处 理 机 系统 。 

A. SISD B. SIMD C. MISD D. MIMD 
4. 流水 线 基 于 的 是 下 列 (  ”) 并 行 技 术 ，。 

A. 时 间 重 县 B. 资源 重复 C. 资源 共享 D. 都 不 是 


5. 以 下 不 属于 流水 线 相 关 的 是 ( ) 。 
A. 结构 相关 B. 执行 相关 C. 数据 相关 D. 控制 相关 

三 、 综 合 题 

1. 什么 是 计算 机 体系 结构 ? 

2. 计算 机 系统 结构 和 计算 机 组 成 及 计算 机 实现 三 者 的 定义 以 及 相互 的 关系 如 何 ? 

3. 并 行 性 的 概念 及 其 包含 的 含义 是 什么 ? 并 行 性 开发 的 途径 有 哪些 ? 

4. 简 述 紧 看 合 和 松 灯 合 的 多 机 系统 结构 。 

5. Flynn 分 类 法 中 的 数据 流 指 的 是 什么 ”多 售 性 指 的 是 什么 ,具体 的 分 类 如 何 ? 

6， 上 网 查询 有 关 Pentium 的 资料 , 简 述 Pentium 微 人 钼 理 莫 的 基本 结构 ; Pentium 微 处 

数 流 水 线 是 怎样 工作 的 ? 

7. 动态 流水 线 和 静态 流水 线 的 区 别 。 

8. 衡量 流水 线 人 处 理 机 性 能 的 指标 主要 是 什么 ?它们 又 是 如 何 定 义 的 ? 流水 的 最 大 在 
吐 量 指 的 是 什么 ? 

9. 流水 线 的 吞吐 量 受 限 于 瓶颈 过 程 ,那么 消除 
有 了 哪些? 

10. 延 开 转移 的 思想 是 什么 ? 

11. 分 文 转 移 预测 功能 的 意义 是 什么 ? 试 举 例 说 明 。 

12. 有 一 个 5 个 功能 段 组 成 的 乘 - 加 双 功 能 的 静态 流水 线 , 乘 由 1 一 2 一 3 一 4 完成 ,加 由 
1 一 4 一 5 完成 ,各 段 延 时 均 为 At, 输 出 可 直接 返回 输入 或 存 人 缓冲 紫 缓 冲 。 现 要 求 计算 长 度 
均 为 6 的 A、B 两 个 向 量 逐 对 元 素 求 和 的 连 乘 积 。 


瓶颈 过 程 对 流水 线 吞 吐 量 的 影响 的 方法 
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(1) 画 出 流水 线 完 成 此 运算 的 时 空 图 ; 

(2) 求 出 顺序 执行 和 采用 流水 方式 执行 两 种 情况 下 分 别 各 需要 多 少 个 At 时 间 
(3) 计算 该 流水 线 的 否 吐 量 、 加 速 比 和 效率 。 

13. 有 一 个 4 有 段 6 拍 的 单 功能 非 线 性 流水 线 , 其 预约 表 如 表 8-1 所 示 。 


表 8-1 预约 表 1 


(1) 求 出 其 冲 罕 回 量 、 延 并 禁止 表 ,并 男 出 其 状态 转移 图 ; 
(2) 求 出 其 流水 线 的 最 佳 调 度 方案 及 此 时 的 最 大 吞吐 量 。 
14. 有 一 个 4 段 6 拍 的 单 功 能 非 线 性 流水 线 , 其 预约 表 如 表 8-2 所 示 。 
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表 8-4 预约 表 2 


(1) 求 出 其 冲突 向 量 C、 延 迟 茶 止 表 下 ,并 画 出 其 状态 转移 图 ， 

(2) 求 出 其 流水 线 的 最 佳 调度 方案 及 此 时 的 最 大 否 吐 量 ; 

(3) 如 果 按 照 (2) 求 出 的 最 佳 调度 方案 送 入 6 个 任务 进入 流水 线 , 画 出 此 时 的 流水 线 时 
空 图 ,并 求 出 其 否 吐 量 、 加 速 比 和 实际 效率 。 

15. 茶 市 双 输 入 端的 加 、` 滋 双 功 能 静态 流水 线 有 1、2、3、4 四 个 子 部 件 , 延 时 分 别 为 At、 
Al、2ZAL、\Al, 其 中 "加 "功能 由 12 一 4 组 成 “ 乘 " 由 1 >34 组 成 ,输出 可 直接 返回 输入 或 锁 
人 存 。 现 和 欲 执行 
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(1) 画 出 此 流水 时 空 图 ,并 标 出 流水 线 人 闯 数 据 变 化 的 情况 ; 
(2) 计算 此 运算 全 部 完成 所 需 的 时 间 及 在 此 期 间 流 水 的 效率 .吞吐 量 、 加速 比 ; 
(3) 将 瓶颈 部 分 再 细 分 , 男 出 解 此 题 的 时 空 图 ; 
(4) 求 出 按 (3) 解 此 题 所 需 的 时 间 及 在 此 期 间 流 水 线 的 效率 、 否 吐 量 、 加 速 比 。 
16. 简 述 什么 是 超 流水 线 处 理 机 和 超标 量 超 流水 处 理 机 。 
17. 徐 述 什么 是 多 处 理 机 系统 。 
18. 简 述 解决 多 处 理 机 中 cache 之 间 的 一 致 性 问题 的 基本 方案 有 哪些。 
19. 举例 说 明 多 处 理 机 操作 系统 有 哪 几 种 ? 并 进行 简单 的 比较 。 
20. 简 述 监听 协议 一 一 MESI 协议 的 4 种 状态 的 含义 。 
21. 多 处 理 机 系统 相对 于 单 处 理 机 系统 而 言 , 两 者 在 并 行 性 的 实现 上 有 何 区 别 与 联系 ? 
22. 多 处 理 机 中 的 并 行 性 表现 在 哪些 方面 ? 开发 多 处 理 机 的 并 行 性 有 哪些 途径 ? 
23. 由 霍 纳 法 则 给 定 的 表达 式 为 下 上 =a(p 二 cd 十 eCF 十 2 十 R)))) ,利用 降低 树 高 的 办 
法 来 加 速 运算 ,那么 : 
(1) 画 出 树 状 流程 图 ; 
(2) 确定 Tp 、.P、Sp 、Ep 的 值 。 
24. 伽 述 并 行 算 法 中 为 提高 并 行 度 而 对 树 状 结构 进行 变换 的 过 程 。 
25. 什么 是 机 和 群 系统 ? 机 群 中 来 用 单一 系统 映像 (SST) 技 术 的 目的 是 什么 ? 
26. 多 处 理 机 系统 与 并 行 处 理 机 的 主要 差别 是 什么 ”多 处 理 机 系统 主要 解决 的 技术 问 
题 是 什么 ? 
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